随着气候变化增加与天气有关的灾害的威胁,对天气控制的研究越来越重要。 天气控制的目标是通过管理具有最佳时间,地点和强度的干预措施来减轻灾害风险。 然而,由于天气现象的规模和复杂性,优化过程极具挑战性,这带来了两大挑战。 首先,获得准确的梯度信息进行优化很困难。 此外,数值天气预报(NWP)模型需要巨大的计算资源,需要以最小的函数评估进行参数优化。 为了应对这些挑战,本研究提出了一种基于黑匣子优化设计天气干预的方法,该方法可以实现高效的探索,而无需梯度信息。 提出的方法在两种不同的控制场景中进行评估:一枪初始值干预和基于模型预测控制的顺序干预。 此外,在减少总降雨量方面,对四种具有代表性的黑箱优化方法进行了比较分析。 实验结果表明,贝叶斯优化实现了比其他优化更高的控制效率,特别是在高维搜索空间中。 这些发现表明,贝叶斯优化是天气干预计算的一种非常有效的方法。
状态空间模型(SSM)已被证明是用于在顺序数据中模拟远程依赖的强大工具。 虽然最近被称为HiPPO的方法已经显示出强劲的性能,并构成了机器学习模型S4和Mamba的基础,但它仍然受到一些特定,表现良好的基础的封闭式解决方案的限制。 SaFARi框架概括了这种方法,使SSM能够从任意帧(包括非正交和冗余框架)构建SSM,从而允许SSM家族中可能存在的“物种”的无限多样性。 在本文中,我们介绍了WaLRUS(使用SSM的远程表示的Wavelets),这是由Daucheies小波构建的SaFARi的新实现。
我们为强化学习代理引入通用的政策包装,确保正式的目标实现保证。 与性能出类拔萃但缺乏严格安全保证的标准强化学习算法相反,我们的包装器选择性地在高性能的基础策略(源自任何现有RL方法)和具有已知收敛属性的回退策略之间切换。 基础策略的价值函数监督此切换过程,确定回退策略何时应该覆盖基础策略,以确保系统保持稳定的路径。 分析证明,我们的包装商继承了后备政策的目标,同时保留或改进了基本政策的执行情况。 值得注意的是,它无需额外的系统知识或在线受限优化即可运行,使其易于跨不同的强化学习架构和任务进行部署。
在本文中,提出了一种新的连续非平滑控制策略,以实现阶梯量子系统的有限时间稳定。 我们首先使用基于距离的Lyapunov函数为阶梯n级量子系统设计通用分数顺序控制定律,然后应用差分内含物意义上的Filippov溶液和LaSalle的不变性原理,以证明在连续非平滑控制定律下阶梯系统解决方案的存在和唯一性。 通过应用Lyappunov稳定性和有限时间稳定性标准,对阶梯系统进行严格的建立。 我们还得出收敛到内在哈密尔顿式特征状态所需的时间的上限。 铷梯三级原子系统上的数值模拟验证了拟议方法的有效性。
我们引入了Multi-CALF,这是一种基于其相对价值改进的智能结合强化学习策略的算法。 我们的方法将标准的RL政策与理论上支持的替代策略相结合,继承了正式的稳定性保证,同时通常比单独任何一种政策都能更好地获得性能。 我们证明我们的综合政策与已知概率设定的指定目标趋同,并在最大偏差和收敛时间上提供精确界限。 对控制任务进行经验验证,在保持稳定性保证的同时,提高了性能。
状态空间模型(SSM)已被证明是用于在顺序数据中模拟远程依赖的强大工具。 虽然最近被称为HiPPO的方法已经显示出强劲的性能,并构成了机器学习模型S4和Mamba的基础,但它仍然受到一些特定,表现良好的基础的封闭式解决方案的限制。 SaFARi框架概括了这种方法,使SSM能够从任意帧(包括非正交和冗余框架)构建SSM,从而允许SSM家族中可能存在的“物种”的无限多样性。 在本文中,我们介绍了WaLRUS(使用SSM的远程表示的Wavelets),这是由Daucheies小波构建的SaFARi的新实现。
目前的侵入性辅助技术旨在推断严重瘫痪患者的高维运动控制信号。 然而,他们面临着重大挑战,包括公众接受,寿命有限和商业化障碍。 与此同时,非侵入性替代品通常依赖于容易发生神器的信号,需要长时间的用户培训,并且难以为灵巧的任务提供强大的高维控制。 为了解决这些问题,本研究引入了一种新的以人为本的多模态AI方法,作为丢失的运动功能的智能补偿机制,这些功能可能使严重瘫痪的患者能够控制高维辅助设备,例如灵巧的机械臂,使用有限和非侵入性的输入。 与当前最先进的(SoTA)非侵入性方法相反,我们的上下文感知,多模态共享自治框架集成了深度强化学习算法,将有限的低维用户输入与实时环境感知相结合,实现对人类意图的自适应,动态和智能解释复杂的灵巧操作任务,例如选择和位置。 我们与超过50,000个计算机模拟事件进行合成用户训练的ARAS(用于在共享自治中放大有限输入的自适应强化学习)的结果证明了拟议的闭环人循环范式的首次成功实现,优于SoTA共享自治算法。 在零射击模拟到真实转移之后,对23个人类受试者进行了ARAS评估,证明了动态意图检测的高精度以及用于灵巧拾取和位置任务的平稳,稳定的3D轨迹控制。 ARAS用户研究实现了92.88辅助技术的高任务成功率。
蜂窝网络需要严格的安全程序和措施,从核心到无线电接入网络(RAN)和最终用户设备。 随着网络变得越来越复杂和相互关联,如在O-RAN部署中,它们面临着许多安全威胁。 因此,确保强大的安全性对于 O-RAN 保护网络完整性和保护用户数据至关重要。 这需要严格的测试方法来减轻威胁。 本文介绍了基于 RAN 的自动化、自适应和可扩展的用户设备 (UE) 安全测试框架,旨在解决现有 RAN 测试解决方案的缺点。 使用商用现成硬件和开源软件构建的5G软件无线电测试台的实验结果验证了RAN Tester UE框架上开发的示例安全测试程序的效率和可重复性。
在动态互动交通中实现快速有效的主动避免碰撞仍然是自动驾驶的核心挑战。 本文提出了REACT(Runtime-Enabled Active Collision-ovoidance Technique),这是一种将风险评估与主动回避控制集成的闭环框架。 通过利用能量传递原理和人车-道路交互建模,REACT动态量化运行时风险并构建一个连续的空间风险场。 该系统集成了物理接地的安全约束,如定向风险和交通规则,以识别高风险区域并产生可行的,可解释的回避行为。 分层警告触发策略和轻量级系统设计可提高运行时效率,同时确保实时响应。 四个具有代表性的高风险场景(包括汽车后制动,切入,后部接近和交叉路口冲突)的评估表明,REACT能够准确识别关键风险并执行主动避免。 它的风险估计与人类驾驶员认知(即警告准备时间<0.4秒)密切相关,实现了100次误报或错过检测。 此外,它还具有卓越的实时性能(<50 ms延迟),强大的远见和概括。 轻量化架构实现了最先进的精度,突出了其在安全关键型自治系统中实时部署的潜力。
紧凑型四足机器人越来越适合在现实场景中部署。 它们体积小,便于与人类环境融合。 然而,在不平坦的地形上进行实时运动仍然具有挑战性,特别是由于地形感知的高计算需求。 本文介绍了一个强大的基于强化学习的外感运动控制器,用于在具有挑战性的地形中资源受限的小规模四足动物,该控制器利用实时高程映射,由仔细的深度传感器选择支持。 我们同时训练一个策略和一个状态估计器,它们共同为高程映射提供了一个测深源,可选地与视觉惯性测光(VIO)融合。 我们证明了定位额外的飞行时间传感器对于保持稳健性的重要性,即使没有VIO,因此有可能释放计算资源。 我们通过实验证明,拟议的控制器可以完美无瑕地穿越高度达17.5厘米的台阶,并实现80控制器也分别实现了高达1.0 m / s和1.5 rad / s的精确向前和偏航速度跟踪。 我们在github.com/ETH-PBL/elmap-rl-controller开源我们的训练代码。
随着最近巨型低地球轨道(LEO)卫星星座的快速发展,多天线网关站(MAGS)已成为通过大规模馈线链路支持极高系统容量的关键推动因素。 然而,空间和地面部分的致密度导致链接之间的空间分离减少,从而带来了前所未有的干扰加剧挑战。 本文研究了基于图形着色的频率分配方法,用于大型LEO系统的干扰缓解(IM)。 我们首先揭示MAGS干扰模式的特征,并使用自适应阈值方法将IM问题制定成K着色问题。 然后我们提出两种量身定制的图形着色算法,即广义全球(GG)和基于Clique的Tabu搜索(CTS),以解决这个问题。 GG采用低复杂性贪婪的避冲突策略,而CTS则利用MAGS带来的独特集团结构来提高IM性能。 随后,我们创新地修改它们,以实现时间连续的频率分配,这对于确保支线链路的稳定性至关重要。 此外,我们进一步设计了两种巨型星座分解方法,以减轻卫星运营商的复杂性负担。 最后,我们提出基于列表着色的空置子通道利用方法,进一步提高频谱效率和系统容量。 第一代和第二代的Starlink星座与34396颗卫星的模拟结果表明了拟议方法的有效性和优势。
深度神经网络(DNN)由于其强大的功能近似功能,越来越多地用于控制应用程序。 然而,许多现有的公式主要侧重于跟踪错误收敛,通常忽略了使用DNN识别系统动力学的挑战。 本文介绍了使用基于DNN的控制器同时进行轨迹跟踪和在线系统识别的第一个结果,无需持续激发。 为DNN所有层的权重构建了两条新的并发学习适应定律,实现了DNN参数估计值与其理想值的邻域的收敛,前提是DNN的Jacobian满足有限时间的激发条件。 进行基于Lyapunov的稳定性分析,以确保跟踪误差,重量估计错误和观察者误差与原点附近趋同。 在一系列具有相同初始和操作条件的系统和轨迹上进行的模拟显示,与基线相比,具有40.5个函数近似性能,同时保持类似的跟踪错误和控制工作。 模拟评估轨迹外数据点的功能近似能力,得出了58.88基线。
塑料注塑成型对现代制造仍然至关重要。 然而,优化工艺参数,在动态的环境和经济条件下平衡产品质量和盈利能力仍然是一个持续的挑战。 本研究提出了基于深度强化学习(DRL)的新型框架,用于注塑成型的实时工艺优化,将产品质量和盈利能力整合到控制目标中。 开发了利润功能,以反映现实世界的制造成本,包括树脂,模具磨损和电价,包括使用时间变化。 构建了代理模型来预测产品质量和循环时间,使用软演员-批评(SAC)和近端策略优化(PPO)算法对DRL代理进行高效的离线训练。 实验结果表明,拟议的DRL框架可以动态适应季节性和操作变化,始终如一地保持产品质量,同时最大限度地提高利润。 与遗传算法等传统优化方法相比,DRL模型实现了可比的经济性能,推理速度高达135倍,使其非常适合实时应用。 该框架的可扩展性和适应性突出了其作为现代制造环境中智能、数据驱动决策的基础的潜力。
我们考虑一个完全分布式无线网络控制系统(WNCS)的联合上行和下行调度问题,频率通道数量有限。 使用随机系统理论的元素,我们得出了WNCS的足够稳定性条件,该条件用控制和通信系统参数表示。 一旦条件得到满足,就存在一个固定和确定性的调度策略,可以稳定WNCS的所有植物。 通过分析和表示WNCS的每一步成本函数,我们以有限长度的可计数向量状态制定最佳传输调度问题,并将其开发基于深度强化学习(DRL)的框架来解决它。 为了应对DRL中大型动作空间的挑战,我们提出了新的动作空间减少和动作嵌入方法,用于可以应用于各种算法,包括Deep Q-Network(DQN),Deep Deterministic Policy Gradient(DDPG)和Twin Delayed Deep Deterministic Policy Gradient(TD3)。 数值结果显示,提议的算法明显优于基准策略。
机械、声学和电子工程中的许多应用都需要估计复杂的动态模型,通常表示为具有结构限制的附加多输入多输出(MIMO)传输功能。 本文介绍了一个估计结构化加法MIMO模型的两级过程,其中结构约束是通过参数向量的加权非线性最小二乘数投影强制执行的,该投影使用最近开发的改进的工具变量算法最初估计。 拟议的方法在开环场景中被证明是一致的,并且无症状的高效。 在闭环设置中,尽管潜在的噪声模型错误排序,它仍然保持一致,并在所有工具变量估计器中实现最小协方差。 进行广泛的模拟以验证理论发现,并显示建议的方法的有效性。
与直接执行任务的人类相比,远程操作中的任务完成时间方面的任务表现仍然远远落后。 与之相关的一个重大影响是人类执行变换和对齐的能力,这直接受到观点和运动重定向策略的影响。 在现代远程操作系统中,运动重定向通常通过一次性校准或切换模式来实现。 复杂的任务,如连接的螺丝,可能很困难,因为操作符必须对齐(例如镜像)旋转和转换输入命令。 最近的研究表明,翻译和旋转的分离导致任务性能的提高。 这项工作提出了一种正式的运动重定向方法,该方法将转换和旋转输入命令分开。 然后,该方法包含在基于最佳控制轨迹规划器中,并显示在UR5e机械手上工作。
我们研究非线性网络系统的可识别性,当网络动力学在边缘和节点上的非线性时,具有部分激发和部分测量。 我们假设图拓扑和节点级别的非线性函数是已知的,我们的目标是识别图形的重量矩阵。 我们的主要结果是证明完全连接的分层前馈网络可以通过令人兴奋的源和测量跨源的分析函数类中的水槽在本地识别。 即使所有其他节点仍然不兴奋和未测量,并且与大多数需要测量和/或激发每个节点的网络可识别性的研究结果形成鲜明对比。 结果特别适用于没有偏移量的前馈人工神经网络,并通过考虑更广泛的功能和拓扑结构来概括以前的文献。
互联自动化车辆(CAV)为革新现有交通系统提供了无与伦比的机会。 在不久的将来,CAV和人驾驶车辆(HDV)有望共存,形成混合交通系统。 尽管已经开发了几个利用CAV的原型交通信号系统,但复杂而现实的混合交通延迟和交叉路口最佳信号定时的近似仍然难以实现。 本文介绍了混合交通隔离交叉口的延迟和最佳循环长度的分析近似值,该框架结合了马尔可夫链分析,汽车遵循模型和排队理论。 鉴于混合交通延迟的复杂性,拟议的框架系统地结合了多种因素的影响,例如CAV和HDV的独特到达和离开行为和进展特征,通过数学推导,以确保现实主义和分析可驾驭性。 随后,导出用于交叉延迟和最佳循环长度的闭合形式表达式。 然后进行数值实验以验证模型,并提供对信号化路口混合交通延误动态的见解。
有效的边缘人工智能用于空间物体探测(SOD)任务,可以促进实时碰撞评估和避免,对于近地轨道上越来越多的空间资产至关重要。 在SOD中,低地球轨道(LEO)卫星必须以高精度和最小的延迟检测其他物体。 我们探索基于基于深度学习的SOD任务视觉传感的边缘AI解决方案,并提出了基于挤压和激励(SE)层,视觉变压器(ViT)和YOLOv9框架的深度学习模型。 我们评估这些模型在各种现实SOD场景中的性能,展示了它们以高精度和非常低的延迟检测多颗卫星的能力。
在机器人等高维领域验证安全关键型自主系统是一项重大挑战。 基于马尔可夫链蒙特卡洛的现有黑箱方法可能需要大量样本,而基于重要性采样的方法通常依赖于简单的参数化家族,这些参数化家族可能难以代表分布而不是失败。 我们建议使用条件去尼化扩散模型对故障的分布进行采样,该模型在复杂的高维问题(如机器人任务规划)中取得了成功。 我们迭代训练扩散模型,以产生更接近失败的状态轨迹。 我们展示了我们在高维机器人验证任务上的方法的有效性,与现有的黑盒技术相比,提高了样品效率和模式覆盖率。
在本文中,我们研究了信息理论框架中过程系统的弹性,从能够最佳构建数据注入攻击的攻击者的角度来看。 攻击旨在分散过程变量的固定分布,同时保持隐身。 这个问题被表述为设计一个多变量高斯分布,以最大限度地提高攻击和攻击下状态估计值的静止分布之间的Kullback-Leibler差,同时最小化传感器测量的分布。 当攻击者对传感器的访问有限时,通过包含稀疏约束来提出稀疏攻击。 我们对攻击构建问题的凸度进行理论分析,并提出了贪婪的算法,该算法能够对测量脆弱性进行系统评估,从而提供对过程系统固有弹性的见解。 我们通过数字评估双反应堆工艺中拟议结构的性能。
在本文中,我们提出了一种新的基于控制屏障函数(CBF)的控制器,用于具有复杂,时间变化的输入约束的非线性系统。 为了处理这些约束,我们引入了一个辅助控制输入,将原始系统转换为增强系统,从而将受限输入问题重新定位为受限输出问题。 这种转变简化了二次编程(QP)的制定,并增强了与CBF框架的兼容性。 因此,建议的方法可以系统地解决复杂、时间变化和依赖于状态的输入约束。 拟议的方法的有效性使用数值示例进行验证。
这封信提出了一个基于Caputo定义的分数顺序电池模型。 导出闭形时间域解决方案,为离散时间实现启用了一个简单的递归表达式。 该模型在每次迭代中只需要当前和以前的时间步骤状态,与传统的Grünwald-Letnikov(G-L)方法相比,显着减少了内存使用量。 这种递归结构与过滤器设计和在线参数识别高度兼容。 在40.2 Ah NCM622单元上的实验验证表明,提出的一阶模型实现了与二阶整数序模型相当的电压预测精度。 结果表明,基于Caputo的模型在准确性和计算效率之间提供了实际平衡,使其非常适合实时电池管理系统(BMS)。
我们解决了识别受附加故障影响的系统的问题,同时通过子空间方法重建故障信号。 我们不要求识别的名义数据,也不对故障类别施加任何假设,例如传感器或执行器故障。 我们表明,在故障信号的温和假设下,标准的PI-MOESP可以恢复与输入输出子系统相关的系统矩阵。 然后我们介绍输出行为等价的概念,它表征具有相同输出行为集的系统,并提出了从系统矩阵中建立这种等价性的方法。 最后,我们展示了如何从数据中估计存在故障信号的完整故障矩阵,其最小维度解释了数据。
由于简化的分析模型和现实世界的复杂性之间的差异,非线性振荡器网络的代孕建模仍然具有挑战性。 为了弥补这一差距,我们研究混合水库计算,将储层计算与“专家”分析模型相结合。 模拟没有确切的模型,我们首先测试了在其专家模型中具有参数错误的代理模型。 其次,在残留的物理任务中,当专家模型缺乏扩展的地面真实模型中存在的关键非线性耦合项时,我们评估它们的性能。 我们专注于跨各种动态系统的短期预测,评估这些替代物用于控制应用。 我们表明,混合储层计算机通常优于标准储层计算机,并且对参数调优表现出更大的稳健性。 这种优势在残留的物理任务中不那么明显。 值得注意的是,与标准储层计算机不同,混合体在穿过观察到的光谱半径阈值时不会降低性能。 此外,专家模式无法利用的动力制度具有良好的性能,这表明了水库的贡献。