AI基础研究具身智能 AI金融

本网站上的内容仅供参考，不提供医疗或其他专业建议，不代表活水快报、贡献者或合作伙伴的观点。

© 2024-2025 活水快报 - 42Digest.

|

京ICP备2024044642号-15

电气工程与系统科学研究快报

相关分类

电气工程与系统科学

Electrical Engineering and Systems Science

音频与语音处理

Audio and Speech Processing

图像与视频处理

Image and Video Processing

信号处理

Signal Processing

电气工程与系统科学

Electrical Engineering and Systems Science

音频与语音处理

Audio and Speech Processing

图像与视频处理

Image and Video Processing

信号处理

Signal Processing

最新研究

使用未知模型的州反馈LQG控制Q-L-Learning的比较研究

我们研究设计一个状态反馈线性二次高斯(LQG)控制器的问题,该系统中的系统矩阵以及过程噪声协方差是未知的。我们在两个方法之间进行了严格的比较。第一个是使用系统识别阶段来估计未知参数的经典阶段,然后用于状态反馈LQG(SF-LQG)控制器设计。第二种方法是最近提出的一种使用称为Q-学习的强化学习范式的方法。我们在生成控制器的复杂性和准确性方面进行比较。我们展示了经典的渐近效率方法,在准确性方面几乎没有改进的余地。我们还提出了一种新的基于Q-learning的方法,我们显示无症状地实现了最佳的控制器设计。我们通过数字高效的算法实现来补充我们提出的方法,旨在使其在计算方面具有竞争力。然而,我们的复杂性分析表明,经典方法在数值上仍然比这种基于Q学习的替代品更有效。然后,我们得出结论,在未知参数的情况下,经典方法仍然是解决SF-LQG设计的最佳选择。

系统与控制

安全受限的AC/DC电网最佳功率流量考虑使用稀疏Tableau公式进行非对称的HVDC网格操作

本文介绍了针对HVDC电网的安全受限最佳功率流(SCOPF)模型,该模型可优化双极换流站的不对称运行,即正极和负转换器杆的不同电流注入,以最大限度地减少单转换器杆中断引起的后应急条件下的运营成本。优化模型允许选择非对称运行的换流站数量。结果表明,增加不对称站的数量会降低运营成本。该分析还提供了对这些成本对不对称操作水平的敏感性的见解。然而,增加的不对称操作导致更高的直流中性电压偏移,可以上升到不希望的水平。对这些抵消施加限制反过来又会增加运营成本。为了减轻这些影响,建议为应急后状态采用中性线切换(NLS)策略。

系统与控制

5G和B5G网络中的主动服务保证:端到端网络切片的闭环算法

第五代(5G)和超越5G(B5G)网络中的服务定制在很大程度上依赖于网络切片,该网络在共享物理基础设施上创建多个虚拟网络,满足不同应用程序的特定需求,使用软件定义网络(SDN)和网络功能虚拟化(NFV)。当务之急是确保网络服务满足各种应用程序和用户的性能和可靠性要求;因此,服务保证是网络切片的关键组件之一。网络切片的关键功能之一是能够扩展虚拟化网络功能(VNF),以应对不断变化的资源需求,并满足客户服务级别协议(SLA)。在本文中,我们引入了一种用于端到端网络编排的主动闭环算法,旨在提供5G和B5G网络中的服务保证。我们专注于动态扩展资源,以满足每个网络切片特有的关键绩效指标(KPI),并在多个切片中并行运行,使其可扩展,并能够完全自动管理实时服务保证。通过我们的实验,我们证明提出的算法有效地满足了不同网络切片类型的服务保证要求,从而最大限度地减少了网络资源利用率,减少了备用资源的过度配置。

网络与互联网架构分布式、并行与集群计算性能系统与控制

随机多智能体系统的正确设计控制综述:基于稳定张体的解决方案

连续空间的离散时间随机系统很难验证和控制,即使由于尺寸性的诅咒而具有MDP抽象。我们提出了一个基于抽象的框架,具有强大的动态编程映射,在时间逻辑满意度方面提供具有可证明下限的控制策略,并通过近似随机模拟关系进行量化。利用解耦动力学,我们揭示了价值函数中的 Canonical Polyadic 分解张量结构,使动态编程具有可扩展性。提议的方法为时间逻辑规范提供了按设计的正确概率保证。我们在连续状态线性随机系统上验证我们的结果。

系统与控制

可重新配置的空域:用于低空ISAC网络的可移动天线和智能表面

低空无人机(UAV)网络是未来6G集成传感和通信(ISAC)系统的组成部分。然而,由于无人机的高机动性、复杂的传播环境以及共存的传感和通信功能之间的固有权衡,它们的部署受到了阻碍。本文提出了一种新的框架,利用可移动天线(MA)和智能反射表面(IRS)作为双重推动因素,以克服这些限制。 MAs通过主动收发器重新配置,IRS通过被动通道重建,可以协同工作,以显着提高系统性能。我们的分析首先阐述了MA和IRS提供的基本收益,并提供了模拟结果,验证了MA-IRS支持的ISAC架构的巨大潜力。然后调查两个核心无人机部署场景:(i)无人机作为ISAC用户,我们专注于实现高精度跟踪和空中安全,以及(ii)无人机作为空中网络节点,我们处理稳健的设计和复杂的耦合资源优化。最后,确定并分析每个场景的关键技术挑战和研究机会,为高级低空ISAC网络的未来设计制定明确的路线。

信息论信号处理

信息容量:通过文本压缩评估大型语言模型的效率

近年来,大型语言模型(LLM)的快速发展及其不断扩大的应用,导致对计算资源的需求激增。普遍采用测试时间扩展进一步加剧了模型能力与资源消耗之间的紧张关系,突出了推理效率的重要性。然而,一个统一指标,准确地反映了LLM在不同模型大小和架构中的效率,仍然不存在。受压缩和智能之间的相关性的激励,我们引入了信息容量,这是一种基于文本压缩性能相对于计算复杂性的模型效率的度量。更大的模型可以更准确地预测下一个令牌,实现更大的压缩增益,但计算成本更高。对主流开源模型的实证评估表明,一个系列中不同大小的模型表现出一致的信息容量。该指标可实现跨模型系列的公平效率比较和模型系列中的准确性能预测。信息容量的一个显著特点是它包含令牌化效率,这会影响输入和输出令牌计数,但在LLM评估中经常被忽视。我们评估5个异构数据集上49个模型的信息容量,并观察标记器效率、预训练数据和混合专家架构的影响的一致结果。

人工智能计算与语言信号处理

通过迭代政策更新和对抗性稳健的非正式预测,在互动环境中进行安全规划

在互动环境中对自主代理的安全规划 - 例如在行人和人控制车辆中控制自动驾驶汽车 - 构成了重大挑战,因为环境的行为是未知的,并且对自主代理的行为作出反应。这种耦合导致交互驱动的分布转变,其中自主代理的控制策略可能会改变环境的行为,从而使现有工作中的安全保障无效。事实上,最近的研究已经使用构象预测(CP)来使用观察到的环境数据生成无分布的安全保障。然而,CP关于数据可交换性的假设在交互式设置中违反了,这是由于循环依赖,其中控制策略更新改变了环境的行为,反之亦然。为了解决这一差距,我们提出了一个迭代框架,通过量化计划的政策更新对环境行为的潜在影响,有力地维护政策更新的安全保障。我们通过对抗性强的CP意识到这一点,我们在每个事件中使用当前政策下的观察数据执行常规CP步骤,但随后通过分析调整CP结果以考虑分配变化,从而在政策更新中转移安全保障。这种调整是基于策略到轨迹的灵敏度分析,从而产生一个安全的、偶然的开环规划器。我们进一步对系统进行收缩分析,提供CP结果和政策更新保证收敛的条件。我们的经验证明这些安全和收敛保证在二维汽车行人案例研究。据我们所知,这些是在此类互动环境中提供有效安全保障的第一个结果。

系统与控制机器人学

认证培训与Lyapunov稳定的神经控制分支和边界

我们研究学习可验证的Lyapunov稳定神经控制器的问题,可以证明满足Lyapunov在吸引力区域(ROA)内的渐近稳定条件。与以前在不考虑训练中验证计算的情况下采用反示例指导培训的作品不同,我们引入了具有分支和边界(CT-BaB)的认证培训,这是一种新的认证培训框架,可以优化认证边界,从而减少培训和测试时间验证之间的差异,这些验证也计算了认证边界。为了对整个感兴趣的输入区域实现相对全球性的保证,我们提出了一种训练时间BaB技术,可以维护动态训练数据集,并自适应地将硬输入次区域拆分成更小的输入,以收紧认证范围并简化培训。同时,培训时间巴布创建的次区域也为测试时间核查提供信息,以便更有效地进行训练意识核查。我们证明CT-BaB产生验证友好的模型,可以在测试时更有效地验证,同时通过更大的ROA实现更强的可验证保证。在最大的输出反馈2D四分子系统上,CT-BaB相对于以前的先进基线减少了超过11倍的验证时间,同时实现了164倍更大的ROA。

机器学习人工智能机器人学系统与控制

通过观察感知屏障功能对随机系统的运行时安全和远程预测

随机动态系统已成为众多应用领域的基本模型,为捕获不确定的系统行为提供了强大的数学表示。在本文中,我们通过在线观测解决了离散时间随机系统的运行时安全性和远达概率预测问题,即估计系统满足给定安全或暴露规范的概率。与仅依赖离线模型的传统方法不同,我们提出了一个包含实时观测的框架,以动态地完善安全性和暴露事件的概率估计。通过引入观测感知障碍函数,我们的方法自适应地更新概率边界,因为收集了新的观测结果,将高效的离线计算与在线向后迭代相结合。这种方法能够在不确定性下对安全性和避免到达概率进行严格和响应式预测。除了理论保证外,基准系统的实验结果证明了拟议方法的实际有效性。

系统与控制

通过自定义CNN模型对早产的视网膜病变进行高效的自动诊断

本文包括使用先进的深度学习方法对早产儿视网膜病变(ROP)诊断的深入检查。我们的重点是改进和评估基于CNN的方法,以实现精确和高效的ROP检测。我们驾驭数据集策划、预处理策略和模型架构的复杂性,与包括模型有效性、计算成本分析和时间复杂度评估在内的研究目标保持一致。结果强调了量身定制的CNN模型相对于预先训练的同行的至高无上地位,这体现在更高的准确性和F1分数上。实施投票制度进一步提高了业绩。此外,我们的研究揭示了拟议的定制CNN模型在减轻与深度神经网络相关的计算负担方面的潜力。此外,我们展示了在专用软件和硬件配置中部署这些模型的可行性,突出了其在临床环境中作为有价值的诊断辅助工具的实用性。总之,我们的话语对ROP诊断做出了重大贡献,揭示了深度学习模型在提高诊断精度和效率方面的功效。

图像与视频处理人工智能计算机视觉与模式识别

带有1位RIS的MIMO通信:渐近分析和空中通道对角化

本文介绍了在Ricean褪色条件下由1位可重新配置的智能表面(RIS)辅助的多输入多输出(MIMO)系统的渐近分析。使用随机矩阵理论,我们表明,在渐近性机制中,发射器-RIS和RIS-接收机通道的主导奇异值和向量收敛到其确定性的视线(LoS)组件,几乎与Ricean因子无关。这使得仅通过闭式符号对齐(SA)规则使用LoS信息进行RIS相位配置,从而最大化通道增益。此外,当 RIS 比收发器阵列无症状地大时,适当的 RIS 配置可以在容量公式中渲染端到端 MIMO 通道,从而消除流间干扰,并在发射器没有通道知识的情况下实现过空(OTA)空间复用。基于这一结果,提出了一种基于渐近位点符号和统计通道参数的节水式SA算法,该算法将RIS元素分配给空间流。模拟结果验证了理论分析,证明拟议的方案实现了与传统黎曼流形优化相当的性能,但运行时数量级较低。

信号处理系统与控制

信念网:一个基于过滤器的框架,从观察中学习隐藏的马尔可夫模型

隐藏的马尔可夫模型(HMM)是模拟顺序数据的基础,但从观察中学习其参数仍然具有挑战性。像Baum-Welch(EM)算法这样的经典方法在计算上是密集的,并且容易发生局部最优,而现代光谱算法提供了可证明的保证,但可能会产生有效范围之外的概率输出。这项工作引入了信念网,这是一个新颖的框架,通过将HMM的远期滤波器作为结构化神经网络来学习基于梯度的优化,通过梯度优化来学习HMM参数。与黑盒 Transformer 模型不同,Belief Net 的可学习权重明确了初始分布、过渡矩阵和发射矩阵的日志,确保了完全可解释性。该模型使用仅解码器架构处理观察序列,并通过标准的自回归次观测预测损失进行端到端训练。在合成 HMM 数据上,与 Baum-Welch 相比,Belief Net 实现了卓越的收敛速度,在光谱方法失败的不完全和超全设置中成功恢复参数。与基于Transformer的模型的比较也出现在现实世界的语言数据上。

机器学习系统与控制概率论

音乐火烈鸟:在音频语言模型中扩展音乐理解

我们介绍了Music Flamingo,这是一种新颖的大型音频语言模型,旨在推进基础音频模型中的音乐(包括歌曲)理解。虽然音频语言研究进展迅速,但由于其动态,分层和信息密集性,音乐仍然具有挑战性。扩展开放式音频理解模型的困难进一步限制了进展,主要是因为高质量的音乐数据和注释稀缺。因此,以前的模型仅限于制作简短的高级字幕,只回答表面问题,并在不同的音乐文化中表现出有限的概括。为了应对这些挑战,我们策划了MF-Skills,这是一个通过多阶段管道标记的大型数据集,产生了丰富的标题和问答对,涵盖和谐,结构,音色,歌词和文化背景。我们在MF-Skills上微调增强的Audio Flamingo 3骨干,进一步加强与音乐理解相关的多种技能。为了提高模型的推理能力,我们引入了一个训练后的食谱:我们首先从MF-Think冷启动,MF-Think是一个基于音乐理论的新型思维链数据集,然后是基于GRPO的强化学习,并带有自定义奖励。音乐火烈鸟在音乐理解和推理的10多个基准中取得了最先进的成果,确立了自己作为一个通才和音乐智能的音频语言模型。除了强有力的经验结果之外,Music Flamingo还通过演示模型如何从表面识别转向分层,类人对歌曲的感知,为高级音乐理解设定了新的标准。我们相信这项工作为社区建立下一代模式提供了基准和基础,这些模型与人类一样有意义地参与音乐。

音频与语音处理计算与语言

多智能体航天器系统的信息驱动故障检测和识别:在轨检查协作任务

这项工作为在低地球轨道上执行协作检查任务的多航天器系统提供了一个全球对本地的任务感知故障检测和识别(FDI)框架。检查任务由全球信息驱动的成本功能代表,该功能集成了传感器模型,航天器姿势和任务级信息增益目标。该公式通过使用相同的成本功能来驱动全球任务分配和地方传感或运动决策,将指导、控制和外国直接投资联系起来。通过比较预期和观察到的任务指标来实现故障检测,而高阶成本梯度措施可以识别传感器、执行器和状态估算器之间的故障。自适应阈值机制可捕获时间变化的检查几何形状和动态任务条件。代表性多航天器检查场景的模拟结果表明了不确定性下的故障定位和分类的可靠性,为弹性自主检查架构提供了统一、信息驱动的基础。

系统与控制人工智能多智能体系统机器人学

联合注意力机制学习促进身体活动期间进行光生理监测

包括光液成像(PPG)在内的光生理监测提供非侵入性的心脏和呼吸测量,但在身体活动期间的运动人工制品(MA)会同时降低其信号质量和下游估计。提出了一个基于注意力机制的生成对抗网络(AM-GAN),以模拟运动文物并减轻其对原始PPG信号的影响。 AM-GAN学习如何将运动影响的PPG转化为人工减少的波形,以与从三轴加速度计获得的人工制品组件对应的三轴加速信号。 AM-GAN已经在四个实验协议中进行了验证,43名参与者执行从低强度到高强度的活动(6-12公里/小时)。通过公共数据集,AM-GAN在IEEE-SPC上实现了心率(HR)为1.81次/分钟的平均绝对误差(MAE),在PPGDalia上达到3.86次/分钟。在内部LU数据集上,它显示了HR的MAE<1.37节拍/分钟和呼吸率(RR)2.49次呼吸/分钟。在AM-GAN中应用了另一个具有三个氧气水平(16%,18%和21%)的内部C2数据集,以实现SpO2的MAE为1.65%。结果表明,AM-GAN在各种强度的身体活动下提供了强大而可靠的生理估计。

信号处理机器学习

用于 MIMO 预编码设计的压缩 CSI 的生成式解码

大型MIMO系统可以提高光谱和能源效率,但它们需要准确的通道状态信息(CSI),随着天线数量的增加,这些信息变得昂贵。虽然机器学习(ML)自动编码器显示了CSI重建和减少反馈开销的前景,但它们引入了标准化、互操作性和向后兼容性的新挑战。此外,培训所需的大量数据收集使现实世界的部署变得困难。为了克服这些缺点,我们提出了一个基于ML的,仅用于压缩CSI的解码器解决方案。我们的方法使用用户端的 CSI 压缩标准化编码器和基站的站点特异性生成解码器,利用环境知识对压缩 CSI 进行改进。我们为生成式解码器引入了两种训练方案:端到端方法和双阶段方法,两者都使用面向目标的丢失函数。此外,我们通过使用特定于站点的数字孪生来生成用于训练的合成 CSI 数据来减少数据收集开销。我们的模拟强调了该解决方案在各种反馈开销系统中的有效性。

信号处理信息论

统一用于实时模型预测控制的顺序二次编程和线性参数变量算法

本文介绍了一个统一框架,连接顺序二次编程(SQP)和迭代线性参数变化模型预测控制(LPV-MPC)技术。使用LPV-MPC的差分公式,我们演示了SQP和LPV-MPC如何通过调度变量和微积分(FTC)嵌入技术的第二基本定理(FTC)嵌入技术的特定选择来统一,并比较它们的收敛特性。这使得SQP的零序方法与LPV-MPC调度技术统一,以提高随机和健壮MPC问题的计算效率。为了证明我们的发现,我们在模拟示例中比较了这两个方案。最后,我们通过将其应用于基于高斯过程(GP)的MPC,通过真实世界的实验,介绍零阶LPV-MPC方法的实时可行性和性能。

系统与控制

基于学习的月球着陆任务的节流发动机动力学建模

典型的登月任务涉及制动的多个阶段,以实现软着陆。这些任务的推进系统配置包括节流发动机。这种配置涉及复杂的互连液压,机械和气动组件,每个部件都表现出非线性动态特性。推进动力学的精确建模对于分析下降过程中的闭环引导和控制方案至关重要。本文介绍了一种基于学习的系统识别方法,用于利用从高保真推进模型获得的数据对节流发动机动力学进行建模。开发的模型通过实验结果进行验证,并用于闭环引导和控制模拟。

系统与控制机器学习

数据中心负载脱耦的分配和管理

人工智能和云数据中心(DC)的耗电量爆炸式增长加剧了人们对其碳足迹的长期担忧,特别是因为DC需要不断的电力冲突,需要电网脱碳所需的不稳定可再生能源发电。 DC灵活性(即负载适应)是通过改善电网可再生吸收来减少直流碳排放的关键。直流灵活性可以创建,而不会通过将数据中心的电力容量和电网负载与能源资源集合相脱耦来降低数据中心容量。由于脱钩可能代价高昂,我们研究如何最好地分配和管理脱钩,以最大限度地提高所有人的利益。主要考虑因素包括站点变化和数据中心-电网合作。我们首先定义和计算数据中心负载解耦的电力和能源需求,然后评估设计的分配和管理方法。评估表明,优化的分布可以提供>98%的潜在电网碳减排,总脱耦需求的70%。对于管理,DC-grid合作(2路共享和控制vs。 1路信息共享)可实现1.4倍电网碳减排。最后,我们表明,脱钩在经济上可能是可行的,因为平均而言,数据中心可以获得比其局部脱钩成本更大的电力成本和碳排放效益。然而,跨站点的偏斜表明可能需要网格干预。

分布式、并行与集群计算系统与控制

多层屏障功能自适应超扭动控制器

本文介绍了一个用于不确定一阶系统的自适应超级扭曲滑动模式控制框架,具有速率绑定扰动,其中绑定是恒定的但未知的。正确定的屏障功能,当用于自调超扭曲控制器时,可能会引入一些与扰动速率约束的初始估计相关的保守主义。此外,算法的离散时间实现并不一定保证闭环轨迹的界限,当两个时间样本之间发生扰动的突然变化时。拟议方法的显著特征涉及将正半确定性屏障功能的使用扩展到Super-Twisting控制器适应,并使用“已设置障碍”方案,以确保解决方案的界限性,即使对于“不利”扰动到采样的时间比。通过Lyapopenov分析和模拟评估闭环系统的稳定性,证明了拟议框架的功效。

系统与控制

继续滚动加载更多