电气工程与系统科学
Electrical Engineering and Systems Science
音频与语音处理
Audio and Speech Processing
图像与视频处理
Image and Video Processing
信号处理
Signal Processing
低空无人机(UAV)网络是未来6G集成传感和通信(ISAC)系统的组成部分。 然而,由于无人机的高机动性、复杂的传播环境以及共存的传感和通信功能之间的固有权衡,它们的部署受到了阻碍。 本文提出了一种新的框架,利用可移动天线(MA)和智能反射表面(IRS)作为双重推动因素,以克服这些限制。 MAs通过主动收发器重新配置,IRS通过被动通道重建,可以协同工作,以显着提高系统性能。 我们的分析首先阐述了MA和IRS提供的基本收益,并提供了模拟结果,验证了MA-IRS支持的ISAC架构的巨大潜力。 然后调查两个核心无人机部署场景:(i)无人机作为ISAC用户,我们专注于实现高精度跟踪和空中安全,以及(ii)无人机作为空中网络节点,我们处理稳健的设计和复杂的耦合资源优化。 最后,确定并分析每个场景的关键技术挑战和研究机会,为高级低空ISAC网络的未来设计制定明确的路线。
近年来,大型语言模型(LLM)的快速发展及其不断扩大的应用,导致对计算资源的需求激增。 普遍采用测试时间扩展进一步加剧了模型能力与资源消耗之间的紧张关系,突出了推理效率的重要性。 然而,一个统一指标,准确地反映了LLM在不同模型大小和架构中的效率,仍然不存在。 受压缩和智能之间的相关性的激励,我们引入了信息容量,这是一种基于文本压缩性能相对于计算复杂性的模型效率的度量。 更大的模型可以更准确地预测下一个令牌,实现更大的压缩增益,但计算成本更高。 对主流开源模型的实证评估表明,一个系列中不同大小的模型表现出一致的信息容量。 该指标可实现跨模型系列的公平效率比较和模型系列中的准确性能预测。 信息容量的一个显著特点是它包含令牌化效率,这会影响输入和输出令牌计数,但在LLM评估中经常被忽视。 我们评估5个异构数据集上49个模型的信息容量,并观察标记器效率、预训练数据和混合专家架构的影响的一致结果。
本文介绍了在Ricean褪色条件下由1位可重新配置的智能表面(RIS)辅助的多输入多输出(MIMO)系统的渐近分析。 使用随机矩阵理论,我们表明,在渐近性机制中,发射器-RIS和RIS-接收机通道的主导奇异值和向量收敛到其确定性的视线(LoS)组件,几乎与Ricean因子无关。 这使得仅通过闭式符号对齐(SA)规则使用LoS信息进行RIS相位配置,从而最大化通道增益。 此外,当 RIS 比收发器阵列无症状地大时,适当的 RIS 配置可以在容量公式中渲染端到端 MIMO 通道,从而消除流间干扰,并在发射器没有通道知识的情况下实现过空(OTA)空间复用。 基于这一结果,提出了一种基于渐近位点符号和统计通道参数的节水式SA算法,该算法将RIS元素分配给空间流。 模拟结果验证了理论分析,证明拟议的方案实现了与传统黎曼流形优化相当的性能,但运行时数量级较低。
包括光液成像(PPG)在内的光生理监测提供非侵入性的心脏和呼吸测量,但在身体活动期间的运动人工制品(MA)会同时降低其信号质量和下游估计。 提出了一个基于注意力机制的生成对抗网络(AM-GAN),以模拟运动文物并减轻其对原始PPG信号的影响。 AM-GAN学习如何将运动影响的PPG转化为人工减少的波形,以与从三轴加速度计获得的人工制品组件对应的三轴加速信号。 AM-GAN已经在四个实验协议中进行了验证,43名参与者执行从低强度到高强度的活动(6-12公里/小时)。 通过公共数据集,AM-GAN在IEEE-SPC上实现了心率(HR)为1.81次/分钟的平均绝对误差(MAE),在PPGDalia上达到3.86次/分钟。 在内部LU数据集上,它显示了HR的MAE<1.37节拍/分钟和呼吸率(RR)2.49次呼吸/分钟。 在AM-GAN中应用了另一个具有三个氧气水平(16%,18%和21%)的内部C2数据集,以实现SpO2的MAE为1.65%。 结果表明,AM-GAN在各种强度的身体活动下提供了强大而可靠的生理估计。
大型MIMO系统可以提高光谱和能源效率,但它们需要准确的通道状态信息(CSI),随着天线数量的增加,这些信息变得昂贵。 虽然机器学习(ML)自动编码器显示了CSI重建和减少反馈开销的前景,但它们引入了标准化、互操作性和向后兼容性的新挑战。 此外,培训所需的大量数据收集使现实世界的部署变得困难。 为了克服这些缺点,我们提出了一个基于ML的,仅用于压缩CSI的解码器解决方案。 我们的方法使用用户端的 CSI 压缩标准化编码器和基站的站点特异性生成解码器,利用环境知识对压缩 CSI 进行改进。 我们为生成式解码器引入了两种训练方案:端到端方法和双阶段方法,两者都使用面向目标的丢失函数。 此外,我们通过使用特定于站点的数字孪生来生成用于训练的合成 CSI 数据来减少数据收集开销。 我们的模拟强调了该解决方案在各种反馈开销系统中的有效性。
贝叶斯优化(BO)是优化昂贵的黑箱目标的强大框架,但由于图形的离散和组合性质,将其扩展到图形结构域仍然具有挑战性。 现有方法通常依赖于完整的图形拓扑 - 不切实际进行大型或部分观察到的图形或增量探索,这可能导致缓慢的收敛。 我们引入了一个可扩展的框架,用于全局优化图形,该框架采用低等级光谱表示,从稀疏的结构观测中构建高斯过程(GP)替代物。 该方法通过可学习的嵌入共同推断图形结构和节点表示,即使在有限的数据下也能实现高效的全局搜索和有原则的不确定性估计。 我们还提供理论分析,为在不同采样制度下准确恢复底层图结构创造条件。 合成和真实世界数据集的实验表明,与之前的方法相比,我们的方法实现了更快的收敛和更好的优化性能。
Nyquist信号调制(NSM)是一种新的信号范式,灵感来自于比Nyquist更快的原则,但基于一种独特的方法,通过精心设计的有限-动力响应滤波器实现受控的符号间干扰。 NSM可以在任何尺寸上工作,包括混合尺寸配置,在过滤器设计,可选能量平衡和保存2-ASK最小平方欧几里拉(MSED)方面提供广泛的灵活性。 真实和合理的挖掘滤波器都经过调查,并且为一维情况下(MS-PRS)中的最佳实击滤波器导出闭合形式表达式,提供分析洞察力和与跨广泛SNR范围的模拟比特错误行为的强烈一致性。 该范式通过模拟低密度生成器矩阵(LDGM)公式在概念上扩展,该公式扩展了NSM家族,并在一个单一的结构一致的框架内统一了调制和编码。 当与LDPC编码相结合时,它能够实现模拟调制和数字LDPC代码之间的高效和自然协同交互。 或者,当模拟LDGM用于源编码和调制时,就会出现一个简单而和谐的联合源通道调制结构。 在这两种配置中,组成块都表现出适合消息传递的基于图形的双图架构,实现了高灵活性和复杂性效率的操作。 总的来说,这些结果为未来6G通信系统建立了有希望的物理层方向。
预计6G网络将整合低地球轨道卫星,通过将覆盖范围扩大到服务不足和偏远地区,以确保全球连通性。 然而,密集巨型星座的部署在通过共享频段运行的卫星中引入了严重的干扰。 这在一定程度上是由于传统频率划分双工(FDD)系统的灵活性有限,其中使用下行链路(DL)和上行链路(UL)传输的固定波段。 在这项工作中,我们建议动态重新分配FDD波段,以改善密集部署中的干扰管理,并评估这种方法的性能增益。 为此,我们制定了一个联合优化问题,将动态波段分配、用户调度和双向功率分配相结合。 这个非凸混合整数问题使用等价变换、交替优化和最先进的工业级混合整数求解器的组合来解决。 数字结果表明,拟议的动态FDD波段分配方法比传统FDD显着提高了系统性能,在密集部署中实现了高达94%的吞吐量提升。
基于雷达的人类活动识别(HAR)仍然缺乏全面的模拟方法。 现有软件基于模型或动作捕获数据开发,因此灵活性有限。 为了解决这个问题,本文介绍了从录制的视频片段(RadHARSimulator V2)中直接生成多普勒光谱的模拟器。 计算机视觉和雷达模块都包含在模拟器中。 在计算机视觉模块中,与全局近邻进行对象检测的实时模型首先用于检测和跟踪视频中的人类目标。 然后,高分辨率网络用于估计检测到的人类目标的二维姿势。 接下来,检测到的人类目标的三维姿势是通过最近的匹配方法获得的。 最后,通过卡尔曼过滤实现平滑的时间三维姿势估计。 在雷达模块中,姿势插值和平滑首先通过Savizky-Golay方法实现。 其次,延迟模型和镜像方法用于模拟自由空间和穿墙场景中的回声。 然后,使用脉冲压缩、移动目标指示和 DnCNN 生成范围时间地图。 接下来,使用短时间傅里叶变换和DnCNN再次生成多普勒时间地图(DTM)。 最后,DTM上的脊特征使用最大的局部能量方法提取。 此外,还提出了基于雷达的HAR的混合并行神经网络架构。 进行和分析数值实验,以证明设计的模拟器和拟议的网络模型的有效性。 这项工作的开源代码可以在:https://github.com/JoeyBGOfficial/RadHARSimulatorV2-Video-to-Doppler-Generator中找到。
当前移动网络中日益拥堵需要创新的解决方案。 本文探讨了毫米波5G网络在城市环境中的潜力,重点是集成接入和回程(IAB)和智能无线电环境(SRE)。 mmWave流量将主要由短爆发组成,以传输大量数据和处理数据的长空期。 这必须改变移动无线电网络的设计方式。 在这种程度上,我们提出了网络规划模型,利用可实现的峰值吞吐量的最大化。 结果突出了这种方法在网络规划阶段的优势,提供了在不牺牲整体网络容量的情况下更好地满足移动流量需求的见解。
基于电肌图(EMG)的运动分类使用机器学习已广泛应用于假体控制等应用中。 虽然之前的研究已经探索了生成组合运动的合成模式,以减少训练数据要求,但这些方法假设组合运动可以表示为基本运动的线性组合。 然而,由于肌肉共收缩等复杂的神经肌肉现象,这种假设经常失败,导致低保真合成信号和降解分类性能。 为了解决这一限制,我们提出了一种新的方法,该方法学习在结构化的潜在空间中合成组合运动模式。 具体来说,我们使用变向自动编码器(VAE)将EMG信号编码为低维表示,并引入混合一致性损失,该损耗构建潜在空间,以便组合运动嵌入其组成基本运动之间。 然后在这个结构化的潜在空间内生成合成模式,并用于训练分类器以识别看不见的组合运动。 我们通过8名健康参与者的上肢运动分类实验验证了我们的方法。 结果表明,我们的方法优于输入空间合成方法,在精度方面提高了约30%。
频率调制连续波(FMCW)雷达可以测量微妙的胸壁振荡,以实现非接触式心跳感应。 然而,传统的基于雷达的心跳传感方法由于噪声而面临性能下降。 基于学习的雷达方法实现了更好的噪声稳健性,但需要昂贵的标记信号进行监督训练。 为了克服这些限制,我们提出了第一个无监督框架,通过增强伪标签和噪声对比(雷达-APLANC)进行雷达心跳感应。 我们建议使用雷达范围矩阵内的心跳范围和噪声范围分别构建正和负样本,以提高噪声稳健性。 我们的噪声对比三胞胎(NCT)损失仅利用传统雷达方法产生的阳性样本,负样本和伪标签信号,从而避免依赖昂贵的地面真实生理信号。 我们进一步设计了一种伪标签增强方法,具有自适应噪声感知标签的选择,以提高伪标签信号质量。 在Equipleth数据集和我们收集的雷达数据集上进行的广泛实验表明,我们的无监督方法实现了与最先进的监督方法相当的性能。 我们的代码、数据集和补充材料可以从https://github.com/RadarHRSensing/Radar-APLANC访问。
本文研究多跳通信设置中的联合学习(FL),例如具有卫星间链路的星座。 在此设置中,部分 FL 客户端负责将其他客户端的结果转发到参数服务器。 而不是使用传统的路由,通信效率可以通过在每个中间跳跃使用网络模型聚合(称为增量聚合(IA))来显着提高。 先前的作品[1]表明,在梯度稀疏下,IA的收益正在减少。 在这里,我们研究这个问题,并提出几个新颖的相关的稀疏方法的IA。 数值结果表明,对于其中一些算法,IA的全部潜力仍然可以在稀疏下产生而不会损害收敛。 我们展示了比传统路由的通信效率提高了15倍,比最先进的(SoA)稀疏IA提高了11倍。
我们通过为这些系统的配电开发一致的配方来研究捏捏天线系统(PASS)的能源效率。 PASS中的每个天线功率分配不是由功率分配策略明确控制,而是通过调整捏合耦合和位置来隐式控制。 这两个因素都是可调的:(i)使用可移动元素调整捏合位置,以及(ii)耦合可以通过改变捏合元件的有效耦合长度来调整。 虽然前者在用户移动性低的设置中动态处理是可行的,但后者不能以高速率解决。 因此,我们开发了一类混合动态静态算法,通过以不同的速率更新系统参数来最大限度地提高能源效率。 我们的实验结果表明,对捏合位置的动态调谐可以显着提高PASS的能源效率。
多梦摄影的自动睡眠阶段分类仍然受到缺乏表现性的时间层次结构,多模态EEG和EOG融合的挑战以及深度学习模型的可解释性有限而受到限制。 我们提出了NeuroLingua,一种受语言启发的框架,将睡眠概念化为结构化的生理语言。 每个30秒的纪元使用基于CNN的标记器分解为重叠的3秒子窗口(“令牌”),通过双级变形金刚实现分层时间建模:本地依赖关系的分段内编码和跨连续七个时代(3.5分钟)的分段间集成,用于扩展上下文。 来自EEG和EOG通道的模态特定嵌入通过图形卷积网络进行融合,促进了强大的多模态集成。 NeuroLingua在Sleep-EDF扩展和ISRUC-Sleep数据集上进行评估,在Sleep-EDF(85.3%精度,0.800宏F1和0.796 Cohen的kappa)上实现最先进的结果,并在ISRUC(81.9%精度,0.802宏F1和0.755 kappa)上达到最先进的结果,在整体和每个指标中匹配或超过已发布的基线。 该架构的注意力机制增强了临床相关睡眠微事件的检测,为睡眠研究中的未来可解释性,可解释性和因果推断提供了原则基础。 通过将睡眠作为一种组合语言,NeuroLingua统一了分层序列建模和多模态融合,将自动化睡眠阶段推向更透明和临床上有意义的应用。
将静态图像编码到尖峰列车中是使尖峰神经网络(SNN)能够高效地处理视觉信息的关键步骤。 然而,诸如速率编码,Poisson编码和时间到先率(TTFS)等现有方案通常忽略空间关系并产生时间不一致的尖峰模式。 在本文中,提出了一种新的基于集群的编码方法,该方法利用局部密度计算来保留空间和时间域中的语义结构。 该方法引入了2D空间集群触发器,通过连接的组件分析和局部密度估计来识别前景区域。 然后,扩展到3D时空(ST3D)框架,该框架共同考虑时间社区,产生具有改善时间一致性的尖峰列车。 对N-MNIST数据集的实验表明,我们的ST3D编码器通过简单的单层SNN实现了98.17%的分类精度,优于标准TTFS编码(97.58%),并在使用显着更少的尖峰(每个样本3800 vs 5000)的同时匹配更复杂的深度架构的性能。 结果表明,这种方法为神经形态计算应用提供了可解释和高效的编码策略。
本文探讨了使用轻量级CNN对环境声音分类(ESC)的降维和集合方法的影响。 我们评估各种超参数设置下的稀疏盐区域池(SSRP)及其变体SSRP-Basic(SSRP-B)和SSRP-Top-K(SSRP-T),并将其与主成分分析(PCA)进行比较。 对ESC-50数据集的实验表明,SSRP-T的准确率高达80.69%,显著优于基线CNN(66.75%)和PCA还原模型(37.60%)。 我们的研究结果证实,经过良好调整的稀疏池策略为ESC任务提供了强大,高效和高性能的解决方案,特别是在资源受限的情况下,平衡准确性和计算成本至关重要。
大规模多输入多输出 - 正交频分多路复用(MIMO-OFDM)系统面临着高通道获取开销的挑战,同时提供了显着的频谱效率(SE)。 可调节的相位移飞行员(APSP)是一种有效的技术,通过利用通道稀疏来获得低开销的通道。 在本文中,我们将它扩展到多个组,并提出多组可调相移试点(MAPSP),以进一步改进SE。 我们首先引入了大规模的MIMO-OFDM系统模型,并将空间频率域中的常规通道模型转换为角度延迟域,获得稀疏通道矩阵。 然后,我们提出了一种通过多个基本序列生成MAPSP的方法,并研究通道估计过程。 通过分析试验干扰的组件,我们阐明了干扰影响MMSE估计的潜在机制。 在这一基础上,我们展示了MAPSP通道估计阶段调度的好处,并建立了为调度量身定制的最佳设计条件。 此外,我们提出了一个基于Zadoff-Chu序列的实施方案,其中包括接收到的信号预处理和试点调度方法,以减轻飞行员干扰。 模拟结果表明,MAPSP方法实现了比APSP更低的估计平均平方误差(MSE),并在移动场景中显着增强了SE。
神经发育障碍,如脆性X综合征(FXS)和自闭症谱系障碍(ASD),其特征是皮质振荡活动中断,特别是在α和伽马频段。 这些异常与注意力,感官处理和认知功能的缺陷有关。 在这项工作中,我们展示了一个基于机器学习的基于机器学习的脑机接口(BCI)系统,该系统旨在通过特定频率的听觉刺激调节神经振荡,以增强FXS个体的认知准备。 脑电图数据来自38名参与者,使用128通道系统,在刺激范式下,由30秒基线(无刺激)组成,然后是70Hz,9Hz,11Hz和13Hz的60秒听觉夹带发作。 对功率光谱特征(Alpha、Gamma、Delta、Theta、Beta)和跨频耦合指标(Alpha-Gamma、Alpha-Beta等)进行了全面分析。 结果确定Peak Alpha Power,Peak Gamma Power和每个通道每秒的Alpha Power是最歧视性的生物标志物。 13Hz刺激条件持续引起Alpha活性的显着增加和Gamma活动的抑制,与我们的优化目标保持一致。 开发了一个监督机器学习框架,用于预测脑电图反应并动态调整刺激参数,从而实现实时、特定主题的适应。 这项工作为认知神经调节建立了一个新颖的EEG驱动的优化框架,为下一代AI集成的BCI系统提供了一个基础模型,旨在实现FXS和相关疾病的个性化神经康复。
语义通信标志着从比特精度传输向以意义为中心的通信的范式转变,随着无线系统接近理论容量限制,这一点至关重要。 生成式AI的出现催化了生成式语义通信,其中接收者通过利用学习的先验来从最小的语义线索中重建内容。 在生成方法中,扩散模型以其卓越的生成质量,稳定的训练动力学和严格的理论基础而脱颖而出。 然而,该领域目前缺乏将扩散技术与通信系统设计联系起来的系统指导,迫使研究人员浏览不同的文献。 本文提供了第一个关于生成语义通信的扩散模型的综合教程。 我们提出基于分数的扩散基础,并系统地审查三个技术支柱:可控制生成的有条件扩散,加速推理的高效扩散,以及跨领域适应的广义扩散。 此外,我们引入了一个逆问题视角,将语义解码重新定位为后验推理,将语义通信与计算成像联系起来。 通过对以人为中心、以机器为中心和以代理为中心的场景的分析,我们说明了扩散模型如何在保持语义保真度和稳健性的同时实现极端压缩。 通过将生成式AI创新与通信系统设计联系起来,本文旨在建立扩散模型,作为下一代无线网络及其他领域的基础组件。
继续滚动加载更多