为了支持使用分散和异构计算资源的基于语言的新兴应用程序,混合语言模型(HLM)提供了一个有前途的架构,其中设备上的小语言模型(SLM)生成由远程大语言模型(LLM)验证和纠正的令牌草稿。 然而,最初的HLM遭受了大量的沟通开销,因为LLM要求SLM上传每个令牌的完整词汇分布。 此外,当LLM验证极有可能被接受的令牌时,通信和计算资源都会浪费。 为了克服这些限制,我们提出了通信高效和不确定性感知的HLM(CU-HLM)。 在CU-HLM中,SLM仅在输出不确定性高时传输截断的词汇分布。 我们通过发现SLM的不确定性与LLM的拒绝概率之间存在很强的相关性来验证这种机会性传播的可行性。 此外,我们理论上得出了最优的不确定性阈值和最优的词汇截断策略。 模拟结果表明,与标准HLM相比,CU-HLM通过跳过74.8保持97.4实现高达206×更高的代币吞吐量。
拥堵控制(CC)严重影响了流媒体、游戏、AR/VR和联网汽车等互联网服务的用户体验。 传统上,CC算法设计寻求通用控制规则,在不同的应用领域和网络产生高性能。 然而,不同的服务需求和网络条件对这种方法提出了挑战。 我们使用自动自定义拥塞控制逻辑以满足服务需求和网络条件的系统共享运营经验。 我们讨论设计、部署挑战和解决方案,通过流媒体、游戏、联网汽车等案例研究来突出性能优势。 我们的系统利用由研究人员开发的基于在线学习的拥塞控制协议PCC Vivace。 因此,除了自定义拥塞控制的见解外,我们还讨论了为适应PCC Vivace进行实际部署而吸取的经验教训和修改。
工业4.0正在通过将机器人集成到共享的人类环境中(如工厂、仓库和医疗保健设施)来改变制造业和物流。 然而,人机碰撞的风险,特别是在非视线(NLoS)场景,如拐角处,仍然是一个关键挑战。 现有的解决方案,如基于视觉和激光雷达系统,通常在遮挡、照明限制或隐私问题下失败,而基于射频的系统则受到范围和准确性的限制。 为了解决这些限制,我们提出了mmMirror,这是一种利用基于Van Atta Array的毫米波(mmWave)可重新配置的智能反射面(IRS)的新型系统,可实现精确,无设备的NLoS定位。 mmMirror与现有的频率调制连续波(FMCW)雷达无缝集成,并提供:(i)强大的NLoS定位,在高达3米的范围内实现厘米级精度。通过动态光束转向来定位场景,以及(iv)通过自适应时间段分配减少扫描延迟。 mmMirror使用商品24 GHz雷达和基于PCB的IRS原型实现,展示了其在动态和复杂环境中实现安全的人机交互的潜力。
6G移动网络是继5G之后的下一个进化步骤,预测移动流量会爆炸式增长。 它提供了超低延迟,更高的数据速率,高设备密度和无处不在的覆盖范围,对各个领域的服务产生积极影响。 节能是电信部门新系统的主要关注点,因为预计所有参与者都将减少碳足迹,以促进减缓气候变化。 网络切片是6G/5G移动网络和其他各种新系统的基本推动因素,如物联网(IoT),车辆互联网(IoV)和工业物联网(IIoT)。 然而,嵌入在网络切片架构中的节能方法仍然是一个研究空白。 本文讨论了如何在网络切片架构中嵌入节能方法,这是全球几乎所有新创新系统的基本推动因素。 本文的主要贡献是在网络切片中节约能源的建议。 这是通过在 NS 架构中部署 ML 原生代理来实现的,可以根据用户需求动态编排和优化资源。 SFI2网络切片参考架构是对比学习改善资源分配节能的具体用例。
在分布式量子应用中,例如纠缠分布、精确的时间同步和高效的时间标记数据处理至关重要。 传统系统经常受到溢出、同步漂移和存储效率低下的影响。 我们提出了一个模块化的时间标记(TT)代理,它使用来自白兔(WR)设备的每秒1脉冲(PPS)信号来实现网络范围的同步,同时应用实时校准,溢出缓解和压缩。 一个实时的双实验室纠缠分布实验验证了系统的性能,实现了25,000计数/秒的同步巧合检测。
6G移动网络是继5G之后的下一个进化步骤,预测移动流量会爆炸式增长。 它提供了超低延迟,更高的数据速率,高设备密度和无处不在的覆盖范围,对各个领域的服务产生积极影响。 节能是电信部门新系统的主要关注点,因为预计所有参与者都将减少碳足迹,以促进减缓气候变化。 网络切片是6G/5G移动网络和其他各种新系统的基本推动因素,如物联网(IoT),车辆互联网(IoV)和工业物联网(IIoT)。 然而,嵌入在网络切片架构中的节能方法仍然是一个研究空白。 本文讨论了如何在网络切片架构中嵌入节能方法,这是全球几乎所有新创新系统的基本推动因素。 本文的主要贡献是在网络切片中节约能源的建议。 这是通过在 NS 架构中部署 ML 原生代理来实现的,可以根据用户需求动态编排和优化资源。 SFI2网络切片参考架构是对比学习改善资源分配节能的具体用例。
在分布式量子应用中,例如纠缠分布、精确的时间同步和高效的时间标记数据处理至关重要。 传统系统经常受到溢出、同步漂移和存储效率低下的影响。 我们提出了一个模块化的时间标记(TT)代理,它使用来自白兔(WR)设备的每秒1脉冲(PPS)信号来实现网络范围的同步,同时应用实时校准,溢出缓解和压缩。 一个实时的双实验室纠缠分布实验验证了系统的性能,实现了25,000计数/秒的同步巧合检测。
空间空地统一集成网络(SAGUIN)将卫星、空中和地面网络集成到统一的通信架构中,是下一代无线系统的一个有前途的候选技术。 在同一频段上传输,更高层的接入点(AP),例如卫星,提供广泛的覆盖范围;同时,由于距离相对较长,它可能会引入显着的信号传播延迟,这可能比面向任务的通信中的数据包持续时间长多倍。 这种现象被建模为一种新的“涟漪效应”,它引入了SAGUIN中时空相关的干扰。 本文研究了具有涟漪效应的SAGUIN中的任务调度问题,并将其制定为马尔可夫决策过程(MDP),以共同最大限度地减少用户的信息年龄(AoI)和AP的能源消耗。 由于涟漪效应引起的高维度、部分观测和动态资源限制,获得的MDP具有挑战性。 为了应对高维度的挑战,我们将原始问题重新塑造为马尔可夫游戏,其中复杂性通过AP之间的互动决策来管理。 同时,为了解决部分观察和动态资源限制,我们采用了经过修改的多代理近端策略优化(MAPPO)算法,其中演员网络根据AP覆盖过滤掉不相关的输入状态,其尺寸可以减少超过一个数量级。 模拟结果表明,拟议方法优于基准,显着降低了用户的AoI和AP的能耗。
本文介绍了VaN3Twin - 第一个开源的全栈网络数字孪生(NDT)框架,用于模拟通过光线跟踪精确物理层建模的多个车辆到所有(V2X)通信技术的共存。 VaN3Twin通过在循环中集成Sionna Ray Tracer(RT)来扩展ms-van3t模拟器,实现无线传播的高保真表示,包括不同的视线(LoS)条件,由于其他车辆的网格,多普勒效应和站点依赖效应而专注于LoS阻塞,例如散射和衍射。 与传统仿真工具不同,拟议的框架支持跨跨跨跨跨共享频谱运行的跨跨跨跨运行频谱的实时共存分析。 专用的干扰跟踪模块可捕获时间频率资源块级别的跨技术干扰,并通过消除单独的LoS / NLoS传播模型诱导的双模态行为等工件来增强信与干扰加噪声比(SINR)估计。 与现场测量相比,VaN3Twin减少了50个环境在现有最先进的仿真工具方面的应用层分歧,证明了其对可扩展和准确的基于数字的基于双X的V2X共存模拟的价值。
TLS 1.3等现代加密协议的采用,对传统的网络流量分类(NTC)方法提出了重大挑战。 因此,研究人员越来越多地转向机器学习(ML)方法来克服这些障碍。 在本文中,我们全面分析了基于ML的NTC研究,开发了其设计选择,基准套件和影响分类器性能的普遍假设的分类法。 通过这种系统化,我们展示了对过时数据集的广泛依赖,设计选择的疏忽以及未经证实的假设的后果。 我们的评估表明,由于使用遗留数据集,大多数提议的加密流量分类器错误地使用了未加密的流量。 此外,通过在最先进的分类器上进行348个特征遮挡实验,我们展示了NTC设计选择的疏忽如何导致过度拟合,并通过经验证据验证或反驳了流行的假设。 通过突出经验教训,我们提供战略见解,确定新出现的研究方向,并推荐最佳实践,以支持现实世界适用的NTC方法的开发。
本文研究了在2G GSM网络中A5/1密码算法的持续使用。 尽管存在已知的漏洞以及一些运营商逐步淘汰GSM技术,但由于4G/5G网络的潜在降级攻击及其在物联网应用中的使用,GSM安全仍然具有相关性。 我们全面概述了与A5系列加密算法相关的历史弱点。 基于此,我们的主要贡献是设计一种测量方法,使用低成本的现成硬件来被动监控由基础收发站(BTS)传输的密码模式命令消息。 我们在10个不同的地点收集了超过50万个样本,重点关注德国三大移动网络运营商。 我们的发现揭示了这些提供商之间的算法使用差异。 一个运营商青睐A5/3,而另一个运营商则对受损的A5/1保持高度依赖。 第三个提供商显示了对A5/3和A5/4的明显偏好,表明GSM网络中向更安全的密码算法转变。
我们开发QUICtester,一种在批准的QUIC协议实现(RFC 9000/9001)中揭示不合规行为的自动化方法。 QUICtester 利用主动自动学习将 QUIC 实现的行为抽象为有限状态机 (FSM) 表示。 与以前的不合规检查方法不同,为了帮助发现状态对事件时时的依赖性,QUICtester介绍了状态学习与事件时序变化的想法,采用有效且无效的输入配置,以及在学习过程中安全和运输层参数的组合。 我们使用对测试QUIC实现的学习行为模型的成正差分析,以属性无关的方式将不合规实例识别为行为偏差。 这利用了许多不同的QUIC实现的存在,消除了对经过验证的正式模型的需求。 不同的实现充当交叉检查测试神谕,以发现违规行为。 我们使用QUICtester分析了来自五个安全设置下的19个QUIC实现中的186个学习模型,并发现了55个实现错误。 值得注意的是,该工具发现了QUIC规范模糊性,导致易于利用的DoS漏洞,导致开发人员的5个CVE分配,以及迄今为止的两个漏洞赏金。
网站指纹识别(WF)是一种技术,允许窃听者通过检查通过一些加密隧道(例如Tor)交换的与数据包相关的元数据来确定目标用户正在访问的网站。 最近使用机器学习(和深度学习)过程构建的WF攻击,并在特征提取阶段总结跟踪元数据。 这种方法导致预测缺乏有关特定网站在由多个顺序网站访问(可能很大)的网络跟踪中检测到给定网站的即时信息 - 一种称为多tab WF的设置。 在本文中,我们探讨了经典时间序列分析技术是否可以在WF设置中有效。 具体来说,我们引入了TSA-WF,这是一种旨在密切保存网络跟踪的时间和方向特征的管道,它能够实现探索旨在测量WF上下文中时间序列相似性的算法。 我们对Tor跟踪的评估表明,TSA-WF在场景中实现了与现有WF攻击相当的准确性,在这种情况下,即使由专门设计的WF防御保护,网站访问也可以很容易地从给定的跟踪中挑出(即单点WF设置)。 最后,虽然TSA-WF在多标签设置中的表现并不优于现有的攻击,但我们展示了TSA-WF如何帮助确定在多标签跟踪中访问给定网站所需的即时性。 本贡献记录版本发表在第20届可用性,可靠性和安全性国际会议的议事录上(ARES 2025)]
工业4.0正在通过将机器人集成到共享的人类环境中(如工厂、仓库和医疗保健设施)来改变制造业和物流。 然而,人机碰撞的风险,特别是在非视线(NLoS)场景,如拐角处,仍然是一个关键挑战。 现有的解决方案,如基于视觉和激光雷达系统,通常在遮挡、照明限制或隐私问题下失败,而基于射频的系统则受到范围和准确性的限制。 为了解决这些限制,我们提出了mmMirror,这是一种利用基于Van Atta Array的毫米波(mmWave)可重新配置的智能反射面(IRS)的新型系统,可实现精确,无设备的NLoS定位。 mmMirror与现有的频率调制连续波(FMCW)雷达无缝集成,并提供:(i)强大的NLoS定位,在高达3米的范围内实现厘米级精度。通过动态光束转向来定位场景,以及(iv)通过自适应时间段分配减少扫描延迟。 mmMirror使用商品24 GHz雷达和基于PCB的IRS原型实现,展示了其在动态和复杂环境中实现安全的人机交互的潜力。
异构网络(HetNets)由于用户要求多样和时间变化的无线条件,对智能管理构成了重大挑战。 这些因素引入了重大决策复杂性,这限制了现有深度强化学习(DRL)方法的适应性。 在许多DRL算法中,特别是那些涉及基于价值或演员批评结构的算法中,评论家组件通过估计价值函数在指导策略学习方面起着关键作用。 然而,传统的评论家模型通常使用浅层架构,将观测结果直接映射到标量估计值,限制了它们处理多任务复杂性的能力。 相比之下,大型语言模型(LLM)的推理时间扩展的最新进展表明,生成中间推理步骤可以显着提高决策质量。 受此启发,我们提出了ReaCritic,这是一个基于推理变压器的评论家模型扩展方案,将推理能力带入DRL。 ReaCritic通过深度变压器堆栈对并行状态动作输入和垂直推理进行水平推理。 它兼容广泛的基于价值和演员批评的DRL算法,并增强了动态无线环境中的推广。 广泛的实验表明,ReaCritic 提高了各种 HetNet 设置和标准 OpenAI Gym 控制任务的收敛速度和最终性能。
目前关于物联网对LEO卫星系统的理论研究通常依赖于不切实际的假设,例如无限的陆地区域和全向卫星覆盖,在理论分析中留下了重大差距,以实现更现实的操作限制。 这些限制涉及有限的陆地区域,有限的卫星覆盖,地球曲率效应,整体上行链路和下行链路分析以及链路依赖干扰。 为了解决这些差距,本文提出了一种新的基于随机几何模型,以严格分析物联网超过LEO卫星系统的性能。 通过采用二项式点进程(BPP)而不是传统的Poisson点工艺(PPP),我们的模型准确地表征了有限地面区域中固定数量的物联网设备的地理分布。 该建模框架为从地面物联网设备到卫星(T-S)和从卫星到地面站(S-ES)的链接提供了距离分布功能,同时还考虑了有限的卫星覆盖范围和地球曲率效应。 为了真实地表示通道条件,中加米褪色模型用于T-S链路,以表征不同的小规模褪色环境,而阴影-Rician褪色模型用于S-ES链接,以捕获阴影和主导视线路径的组合效应。 此外,分析还包含上行链路和下行链路干扰,确保系统性能的全面评估。 我们理论框架的正性和有效性通过广泛的蒙特卡洛模拟进行验证。 这些结果为各个链接和整个系统的关键性能指标(如覆盖率概率和平均人体工学率)提供了见解。
随着网络攻击变得越来越复杂,提高机器学习(ML)模型的稳健性必须是各种规模的企业的优先事项。 为了可靠地比较企业计算机网络中用于网络攻击检测的不同ML模型的稳健性,必须在标准化条件下对其进行评估。 这项工作提出了多个决策树集成的有条不紊的对抗性稳健性基准,其中包含从标准数据集生成的受限对抗性示例。 在原始CICIDS2017数据集(指定为NewCICIDSDS的校正版本)和包含更多网络流量的HIKARI数据集上评估了定期和对抗训练的RF,XGB,LGB和EBM模型的稳健性。 NewCICIDS带来了性能更好的模型,特别是XGB和EBM,但RF和LGB对HIKARI最近的网络攻击不那么强大。 总体而言,模型对对抗性网络攻击示例的稳健性得到了提高,而没有将其推广到经常流量受到影响,从而能够可靠地检测可疑活动,而不会造成误报。
跨越远程的纠缠分布对于许多量子应用至关重要。 目前,远程纠缠分布的实际方法依赖于光纤进行现场纠缠分布。 然而,由于固有的限制,基于纤维的方法无法进行全球范围的纠缠分布。 本文研究了一种新的混合地卫星量子网络架构(QuESat),用于全球规模的纠缠分布,将地面光纤网络与由低地球轨道卫星构建的全局级无源光网络集成在一起。 卫星网络提供基于近真空光束导轨的动态构建,这些导轨通过可调的透镜阵列构建,将光子从一个地面站转发到另一个地面站,与使用光纤相比,在长距离上的效率非常高。 为了评估QuESat对全球通信的可行性和有效性,我们制定了光路配置和纠缠分布问题,考虑到卫星的轨道动力学和地面用户的时间变化纠缠需求。 开发一个两阶段算法,分别动态配置光束导轨和分配纠缠。 该算法结合了用于光路径配置的随机和确定性四舍五入,以实现全球连接,并结合最佳纠缠交换,用于分配纠缠以满足用户的需求。 通过开发地面卫星量子网络模拟器,QuESat与中继器网络相比实现了多倍的改进。
第五代(5G)网络在支持新兴应用方面面临限制,如人工智能(AI)、虚拟现实(VR)和数字孪生。 为了克服这些限制,亚Terahertz(亚太赫兹)和Teraherz(太赫兹)技术被认为是有效6G无线通信的关键推动因素,提供更高的传输速度,更长的范围和更广泛的带宽。 实现这些功能需要对6G收发器进行仔细的工程,重点是前端的高效功率放大器(PA),这些光能对远距离有效放大和传输信号起着关键作用。 补充金属氧化物氧化物半导体(CMOS)技术基于PA在亚太赫兹遭受严重的寄生和有限的最大频率,然而,这最终已被不同的设计架构和缩小CMOS技术的解决,以突破频率限制。 在这篇文章中,我们回顾了CMOS技术在设计6G硬件方面的潜力和能力,确定了亚THz频段中最先进的PA设计,然后进行了检查,并比较了设计,以确定合适的设计策略以获得更好的性能。 电路优化技术,如耦合线,无源增益增强方法,零度功率分裂,负载拉力匹配,二极管和电容器线性化,以获得更好的增益,饱和输出功率和功率增加效率,被认为是不同亚THz频段的PA设计架构。 此外,这些方法被总结和讨论,其优点和缺点代替它们的表现。 还介绍了PA的设计趋势,挑战和未来前景。 因此,本综述文章将作为未来射频集成电路(RFIC)PA设计的比较研究和参考。
在移动网络研究中,将用户设备(UE)等现实世界的组件与开源网络基础设施的集成至关重要,但具有挑战性。 为了解决这些问题,我们引入了 open5Gcube,这是一个模块化框架,旨在将流行的开源移动网络项目集成到统一的管理环境中。 我们公开可用的框架允许研究人员灵活地组合不同的开源实现,包括不同的版本,并通过容器化和轻量级编排来简化实验设置。 我们通过评估 open5Gcube 与多个移动端(2G、4G和5G)的各种商用现成(COTS)智能手机和调制解调器的兼容性,证明了 open5Gcube 的实际可用性。 研究结果强调了我们方法的多功能性和可重复性,大大推动了移动网络实验室严格实验的可访问性。
开放无线电接入网络(O-RAN)中的冲突缓解(CM)是一个随着商业O-RAN部署变得更加复杂而变得越来越重要的主题。 虽然对CM的研究已经涵盖了模拟网络场景,但它缺乏使用真实世界部署和Over The Air(OTA)射频(RF)传输的验证。 我们的目标是使用真实世界的测试平台和OTA RF传输对O-RAN的冲突缓解框架(CMF)进行首次评估。 本文介绍了使用O-RAN开放测试和集成中心(OTIC)内置的专用测试平台进行的实验结果,以确认现有研究提出的冲突解决(CR)方案之一的有效性。 结果表明,实施的冲突检测和解决机制通过将测量的Downlink(DL)吞吐量的可变性降低78来显着改善网络运行稳定性
传统的网络驻留功能(例如防火墙、网络地址翻译)和中间框(卡、负载均衡器)已从专用设备转移到基于软件的组件。 然而,L2/L3网络功能(NF)正在网络功能虚拟化(NFV)平台上实现,这些平台广泛利用内核旁路技术。 他们经常使用DPDK进行零拷贝交付和高性能。 另一方面,L4/L7中间框更强调功能,它利用了成熟的基于内核的系统。 L2/L3 NF 和 L4/L7 中间盒继续由不同节点上的不同平台处理。 本文提出了MiddleNet,它开发了一个支持L2/L3 NF和L4/L7中间盒的统一网络驻留函数框架。 MiddleNet 支持在 NFV 和中间框环境中必不可少的功能链。 MiddleNet使用数据平面开发工具包(DPDK)库进行零复制数据包传递,而无需基于中断的处理,以实现NFV所需的“即线”L2/L3处理性能。 为了支持L4/L7中间框功能,MiddleNet使用一个基于内核的协议堆栈进行处理,避免了每个函数的专用协议栈。 MiddleNet充分利用了扩展的Berkeley Packet Filter(eBPF)的事件驱动功能,并将其与共享内存无缝集成,以实现L4/L7中间盒功能链中的高性能通信。 L4/L7 中 MiddleNet 的开销严格来说是负载相称的,无需基于 DPDK 方法的专用 CPU 核心。 MiddleNet通过利用Single Root I/O Virtualization(SR-IOV)动态选择所需的数据包处理来支持依赖流的数据包处理(Layers 2-7)。 我们的实验结果表明,MiddleNet在如此统一的环境下实现了高性能。
延迟是互联网服务性能的关键指标。 持续跟踪客户端请求的延迟,使服务运营商能够快速识别瓶颈,执行自适应资源分配或路由,并减轻攻击。 被动测量中间有利位置的响应延迟是有吸引力的,因为它可以深入了解真实客户的体验,而无需客户端仪器或产生查询开销。 本文介绍了 PIRATE,这是一种被动的方法来测量响应延迟,当只有客户端到服务器的流量是可见的,即使传输头是加密的。 PIRATE 估计因果对之间的时间间隔 - 两个请求,这样对第一个请求的响应触发第二个 - 作为客户端响应延迟的代理。 我们使用逼真的Web应用程序的实验表明,PIRATE可以估计客户端应用程序层测量的响应延迟在1%以内。 PIRATE增强的层-4负载平衡器(带DSR)将尾部延迟减少了37%。
无服务器计算有望提高资源效率和降低用户成本,但受到重量级CPU绑定数据平面的负担。 以前利用共享内存的努力减少了本地的开销,但在跨节点扩展时却不足。 此外,无服务器环境可能具有不可预测和大规模的多租户,导致共享网络资源的争夺。 我们介绍了Palladium,一个以DPU为中心的无服务器数据平面,可减轻CPU负担,并在多租户无服务器云中实现高效,零复制的通信。 尽管DPU内核的通用处理能力有限,但Palladium通过(1)通过RDMA将数据传输卸载到高性能NIC内核,结合节点内共享内存以消除跨节点的数据副本,战略性地利用DPU的潜力,(2)启用交叉处理器(CPU-DPU)共享内存以消除冗余数据移动,这压倒了懦弱的DPU核心。 Palladium的核心是支持DPU的网络引擎(DNE) - 一种轻量级反向代理,可将RDMA资源与租户功能隔离,协调主结RDMA间流,并在争议中强制执行公平性。 为了进一步减少 CPU 的参与,Palladium 在云入口执行早期 HTTP/TCP-to-RDMA 传输转换,在客户端流量进入 RDMA 结构之前弥合了协议不匹配,从而避免了沿着关键路径进行昂贵的协议转换。 我们表明,仔细选择 RDMA 原语(即双面而不是片面)会显著影响零拷贝数据平面。 我们的初步实验结果表明,在Palladium中实现DPU卸载使RPS提高了20.9倍。 在最好的情况下,延迟减少了21倍,同时节省了多达7个CPU内核,并且只消耗了两个懦弱的DPU内核。
如今,生成式AI(GenAI)通过使机器能够跨模式创建内容来重塑众多领域。 随着GenAI发展成为能够推理、协作和交互的自主代理,它们越来越多地部署在网络基础设施上,以自动为人类服务。 这种新兴的范式,即所谓的代理网络,由于需要纳入以自然语言表达的人类用户的主观意图,因此提出了新的优化挑战。 传统的通用深度强化学习(DRL)努力捕捉意图语义并动态调整策略,从而导致次优。 在本文中,我们介绍了LAMeTA,一种大型AI模型(LAM)授权的两阶段方法,用于意图感知代理网络优化。 首先,我们提出了面向意图的知识蒸馏(IoKD),它有效地提炼了从资源密集型的LAM到轻量级边缘LAM(E-LAM)的意向理解能力,为最终用户提供服务。 其次,我们开发Symbiotic Reinforcement Learning(SRL),将E-LAM与基于策略的DRL框架集成。 在SRL中,E-LAM将自然语言用户意图翻译成结构化的偏好向量,引导状态表示和奖励设计。 DRL反过来根据实时网络条件优化生成服务功能链组成和E-LAM选择,从而优化主观体验质量(QoE)。 在具有81个代理的代理网络中进行的大量实验表明,IoKD通过高达22.5最大化意图感知QoE来减少意图预测中的平均平方误差。