非本地游戏测试在量子系统中的非局部性和纠缠,并用于在不受信任的设备中认证量子态的自我测试。 然而,这些协议是针对理想状态量身定制的,因此逼真的噪音可以防止最大的违规行为,并使许多部分非本地州未被检测到。 根据噪声的“坚固性”选择自我测试可以针对特定应用定制协议,但目前的文献缺乏标准化的噪声稳健性度量。 创建这样的度量具有挑战性,因为没有操作措施来比较不同尺寸和输入输出设置的测试。 我们提出并研究了三种比较措施:噪音耐受性,说服力和称为间隙得分的说服力的分析近似。 我们的计算实验和分析框架表明,说服力为噪声强性提供了最细致入微的衡量标准。 然后我们展示,CHSH游戏具有最高的噪声-强率与更复杂的游戏(2-CHSH变体和Magic Square游戏)相比,当给予相等的资源时,而对于不平等的资源,一些2-CHSH变体可以以高资源成本超越CHSH。 这项工作为比较自测试协议中的噪声强性提供了第一个系统化和操作框架,为理解自检的噪声强性和量子资源利用率的实际改进的理论进展奠定了基础。
这项工作通过利用Coo等人引入的框架,在量子学习算法的预期概括误差上建立一个新的上限家族,促进了对量子学习的理论理解。 (2024年)和预期真实损失的新定义。 我们的主要贡献是在量子和经典Rényi发散方面推导这些边界,使用用于评估量子Rényi发散的变异方法,特别是Petz和新引入的改良夹层量子Rényi发散。 从分析和数字上,我们展示了使用修改三明治量子雷尼发散的界限与基于Pets发散的界限的优性能。 此外,我们使用两种不同的技术提供概率广义误差边界:一种基于修改的三明治量子雷尼发散和经典雷尼发散,另一种采用平滑最大雷尼发散。
为了支持使用分散和异构计算资源的基于语言的新兴应用程序,混合语言模型(HLM)提供了一个有前途的架构,其中设备上的小语言模型(SLM)生成由远程大语言模型(LLM)验证和纠正的令牌草稿。 然而,最初的HLM遭受了大量的沟通开销,因为LLM要求SLM上传每个令牌的完整词汇分布。 此外,当LLM验证极有可能被接受的令牌时,通信和计算资源都会浪费。 为了克服这些限制,我们提出了通信高效和不确定性感知的HLM(CU-HLM)。 在CU-HLM中,SLM仅在输出不确定性高时传输截断的词汇分布。 我们通过发现SLM的不确定性与LLM的拒绝概率之间存在很强的相关性来验证这种机会性传播的可行性。 此外,我们理论上得出了最优的不确定性阈值和最优的词汇截断策略。 模拟结果表明,与标准HLM相比,CU-HLM通过跳过74.8保持97.4实现高达206×更高的代币吞吐量。
现代开放和软化系统(如O-RAN电信网络和云计算平台)托管独立开发的应用程序,具有不同的、可能相互冲突的目标。 协调此类应用程序的行为以确保稳定的系统运行带来了重大挑战,特别是当每个应用程序的实用程序只能通过昂贵的黑箱评估访问时。 在本文中,我们考虑了一个集中优化框架,其中系统控制器向代表不同应用程序的多个战略参与者建议联合配置,目标是将其激励机制调整为稳定的结果。 为了模拟这种交互,我们制定了一个Stackelberg游戏,其中中央优化器无法访问分析实用函数,而是必须通过顺序的多保真评估来学习它们。 为了应对这一挑战,我们提出了MF-UCB-PNE,这是一种新颖的多保真贝叶斯优化策略,利用预算受限的采样过程来近似纯纳什均衡(PNE)解决方案。 MF-UCB-PNE系统地平衡了低成本近似的勘探与高保真开采步骤,从而实现与激励兼容配置的高效融合。 我们为查询成本与均衡准确性之间的权衡提供了理论和实证见解,证明了MF-UCB-PNE在有限成本预算下确定有效均衡解决方案的有效性。
用大型语言模型(LLM)写小说提出了一个关键问题:人类创作的大纲需要多少才能产生高质量的百万字小说? 虽然DOME,Plan Write和Long Writer等框架提高了风格连贯性和逻辑一致性,但它们主要针对较短的小说(10k-100k)字,使超长一代基本上未被探索。 利用LLMZip和LLM2Vec等最近文本压缩方法的见解,我们进行了信息理论分析,量化了LLM在不同压缩扩展比下压缩和重建超长小说时发生的失真。 我们引入了分层的两级生成管道(大纲 -> 详细大纲 -> 手稿),并找到一个平衡信息保存与人类努力的最佳轮廓长度。 通过对中国小说的广泛实验,我们建立了两阶段的分层大纲方法,与单阶段方法相比,大大减少了语义失真。 我们的研究结果为作者和研究人员提供了基于经验的指导,并与LLM合作创作了百万字小说。
用大型语言模型(LLM)写小说提出了一个关键问题:人类创作的大纲需要多少才能产生高质量的百万字小说? 虽然DOME,Plan Write和Long Writer等框架提高了风格连贯性和逻辑一致性,但它们主要针对较短的小说(10k-100k)字,使超长一代基本上未被探索。 利用LLMZip和LLM2Vec等最近文本压缩方法的见解,我们进行了信息理论分析,量化了LLM在不同压缩扩展比下压缩和重建超长小说时发生的失真。 我们引入了分层的两级生成管道(大纲 -> 详细大纲 -> 手稿),并找到一个平衡信息保存与人类努力的最佳轮廓长度。 通过对中国小说的广泛实验,我们建立了两阶段的分层大纲方法,与单阶段方法相比,大大减少了语义失真。 我们的研究结果为作者和研究人员提供了基于经验的指导,并与LLM合作创作了百万字小说。
大规模随机访问是在下一代无线通信系统中实现超大规模连接的重要技术。 它旨在解决初始访问阶段的主要挑战,包括活跃用户检测(AUD)、信道估计(CE)和数据检测(DD)。 本文研究了大规模多输入多输出(MIMO)系统中的大规模访问,其中深度学习用于解决具有挑战性的AUD,CE和DD功能。 首先,我们引入了针对可变试点长度访问量身定做的Transformer-AUD方案。 这种方法将飞行员长度信息和空间相关性模块集成到基于变压器的探测器中,使单个模型能够跨各种试点长度和天线号进行概括。 接下来,我们提出了一个生成扩散模型(GDM)驱动的迭代CE和DD框架。 GDM采用评分功能来捕获大量MIMO通道和数据符号的后验分布。 分数函数的一部分是通过神经网络从通道数据集中学习的,而剩余的分数组件则通过应用符号前置星座分布和已知传输模型以封闭形式导出。 利用这些后验,我们设计了一个异步交替CE和DD框架,该框架采用预测校正器采样技术,在反向扩散过程中迭代生成通道估计和数据检测结果。 模拟结果表明,我们提出的方法在 AUD、CE 和 DD 方面显著优于基线方法。
聚类是一种广泛使用且功能强大的机器学习技术,但其有效性通常受限于需要指定聚类数量,k,或者依靠隐式确定k的阈值。 我们引入了 k*-means,这是一种新颖的聚类算法,消除了设置 k 或任何其他参数的需要。 相反,它使用最小描述长度原则,通过拆分和合并簇来自动确定最优的簇数量,同时优化标准k-均值目标。 我们证明 k*-means 保证收敛,并通过实验证明,在 k 未知的场景中,它显著优于现有方法。 我们还表明,它在估计 k 时是准确的,并且其运行时与现有方法具有竞争性,并且与数据集大小很好地扩展。
空中计算(AirComp)已成为一项有前途的技术,通过无线信道实现同步传输和计算。 在本文中,我们调查了多个集群中的网络化AirComp,允许进行多样化的数据计算,这还受到收发器协调和干扰管理的挑战。 特别是,我们的目标是最大限度地提高多组加权和AirComp速率,其中传输标量和接收波束成形在解决干扰问题时共同调查。 从优化的角度来看,我们分解了制定的问题,并采用迭代过程的交替优化技术来近似解决方案。 然后,我们通过算法展开的原理重新解释迭代,其中通道条件和AirComp网络中的相互干扰构成了一个底层图形。 因此,拟议的展开架构学习图形神经网络参数化的权重,该神经网络通过随机梯度下降方法进行训练。 模拟结果表明,我们的建议优于常规方案,拟议的展开图学习大大减轻了干扰,并实现了卓越的计算性能,并具有强大而高效的适应动态和可扩展的网络。
我们考虑一个完全分布式无线网络控制系统(WNCS)的联合上行和下行调度问题,频率通道数量有限。 使用随机系统理论的元素,我们得出了WNCS的足够稳定性条件,该条件用控制和通信系统参数表示。 一旦条件得到满足,就存在一个固定和确定性的调度策略,可以稳定WNCS的所有植物。 通过分析和表示WNCS的每一步成本函数,我们以有限长度的可计数向量状态制定最佳传输调度问题,并将其开发基于深度强化学习(DRL)的框架来解决它。 为了应对DRL中大型动作空间的挑战,我们提出了新的动作空间减少和动作嵌入方法,用于可以应用于各种算法,包括Deep Q-Network(DQN),Deep Deterministic Policy Gradient(DDPG)和Twin Delayed Deep Deterministic Policy Gradient(TD3)。 数值结果显示,提议的算法明显优于基准策略。
移动设备的激增和实时状态更新应用程序促使信息时代(AoI)背景下的数据新鲜度优化。 与此同时,不断增长的计算需求激发了对CPU调度的研究。 由于以前的CPU调度策略忽略了数据新鲜度,以前的年龄最小化策略只考虑了恒定的CPU速度,我们制定了第一个CPU调度问题,作为具有不可计数空间的受限半马尔可夫决策过程(SMDP)问题,旨在最大限度地减少信息的长期平均年龄,受到平均CPU功率限制。 我们优化策略,指定 CPU 何时睡眠,并在执行更新处理任务时调整 CPU 速度(时钟频率)。 我们考虑可预测的任务大小(PTS)和不可预知的任务大小(UTS)情况的年龄最小CPU调度问题,其中任务大小分别在任务的开始(PTS)或完成(UTS)时实现。 为了解决非凸目标,我们使用Dinkelbach的分数编程方法将我们的问题转化为平均成本SMDP。 我们开发一种基于价值迭代的算法,并证明其融合,以获得PTS和UTS系统的最佳策略和结构结果。 与恒定的CPU速度相比,数值结果表明,我们提出的方案可以将AoI降低50%或更多,在更严格的功率限制下增加好处。 此外,对于给定的AoI目标,年龄最小的CPU调度策略可以将能耗降低50%或更多,当任务大小分布表现出更高的方差时,AoI会减少。
我们提出了一种新的、直观的迭代不确定性量化指标(UQ),即类碰撞的患病率定义为在不同类中观察到的相同输入。 我们使用类碰撞的速度来定义碰撞矩阵,这是一个新颖且独特的细粒度的不确定性度量。 对于涉及 K 类的分类问题,K× K 碰撞矩阵 S 测量区分每对类的固有难度。 我们讨论了碰撞矩阵的几个应用,建立了它的基本数学属性,以及显示它与现有UQ方法的关系,包括贝叶斯错误率(BER)。 我们还通过提出一系列估计S的创新技术来解决使用一热标记数据估计碰撞矩阵的新问题。 首先,我们学习一个对的对比模型,它接受两个输入,并确定它们是否属于同一类。 然后我们证明这个对比模型(PAC可学习)可以用来估计S的Gramian矩阵,定义为G=S^TS。 最后,我们表明,在合理的假设下,G可用于唯一恢复S,这是非负矩阵的新结果,可能是独立的兴趣。 通过建立估计S的方法,我们演示了S的这种估计值与对比模型一起如何用于估计任何点的后类可移植性分布。 还介绍了实验结果,以验证我们估计几个数据集上的碰撞矩阵和类后验分布的方法。
我们展示了反射外对角线可配置智能表面(BD-RIS)的第一个实验原型,即具有可重新配置元素间连接的RIS。 我们的BD-RIS由天线阵列组成,其端口由可调负载网络终止。 后者可以用三个不同的单个负载终止每个天线端口或将其连接到相邻的天线端口。 在分散丰富的环境中进行广泛的性能评估验证元素间连接是有益的。 此外,我们观察到,我们提到的可调负载网络的硬件约束显着影响,第一,可实现的性能,第二,具有元素间连接的好处,第三,优化过程中相互耦合意识的重要性。
最近的工作表明,矩阵乘法问题的量化可以通过使用嵌套的格子代码对每个矩阵中的每个列进行量化,然后乘以去量子化的矩阵来优化解决。 进一步证明,当使用子尺寸d和速率R的产品代码时,可以通过查询大小为2^2dR的查找表(LUT)来实现去量化和内部产品操作,但这只有在dR足够小时才有用。 这反过来将基于LUT的内部产品解码限制在低速率的量化器。 在这项工作中,我们开发了一个速率R分层嵌套格子量化框架,该框架将每个向量量化为M层,并允许使用大小为2^2dR/M的LUT进行基于LUT的内部产品解码,允许高速率量化。 与标准嵌套晶格量子化器相比,我们提供了开发方案损失的分析边界,并且从数字上说明这种损失可以忽略不计。 因此,我们的方案能够在不影响整体失真的情况下使用小型LUT。
实际上,低地球轨道(LEO)和中地球轨道(MEO)卫星网络由多个轨道组成,其中有许多卫星。 低地轨道或近地天体卫星的一个广泛使用的空间结构是沃克星座,轨道的经度同样间隔,卫星也沿着轨道间隔。 在本文中,我们为Walker星座开发了一个随机几何模型。 这个提议的模型允许基于动态系统理论的分析,它允许人们解决基本的结构特性,如周期性和人体工学。 它还可以实现随机几何分析,根据该分析,我们将典型用户在给定纬度的下行链路通信的性能作为关键星座参数的函数。
在世界各地,人们对新的波形,特别是Zak-OTFS以及空中实施越来越感兴趣。 OFDM和Zak-OTFS之间的选择与其说是波形之间的选择,不如说它是防止载波间干扰(ICI)和拥抱ICI之间的架构选择。 在OFDM中,一旦知道输入输出(I/O)关系,均等化就相对简单,至少在没有ICI的情况下。 然而,在ICI的存在下,I/O关系是不可预知的,其获取是非微不足道的。 相比之下,由于符号间干扰(ISI),Zak-OTFS中更多地涉及均衡,但I/O关系是可以预测的,其获取很简单。 Zak-OTFS在双倍传播的6G用例中表现出卓越的性能,具有高延迟/多普勒通道扩散(即高移动性和/或大单元),但架构选择受当今和未来的典型用例的约束。 典型的东西在某种程度上取决于地理位置,因为大延迟差是大型电池的特征,这是许多重要无线市场中的规则而不是例外。 本文提供了循环前缀OFDM(CP-OFDM)和Zak-OTFS在6G传播环境中的全面性能比较。 性能结果提供了对基本架构选择的见解。
本文建议将给定带宽中观察到的有限能量信号表示为概率分布的参数,并使用信息几何框架计算这些信号之间的Fisher-Rao距离,视为分布。 观测结果由它们的离散傅里叶变换表示,这些变换被建模为具有固定对角线协方差矩阵和参数化手段的复杂高斯向量。 参数定义了统计流形的坐标系。 这项工作调查了为Fisher-Rao距离获得闭式表达式的可能性。 我们研究了两个案例:代表给定带宽中观察到的任何有限能量信号的一般情况和观察到具有已知量级频谱和未知相位光谱的衰减信号的参数化示例,我们计算了两种情况的Fisher-Rao距离。 有限能量信号流形对应于具有已知协方差矩阵的高斯分布的流形,已知大小频谱信号的流形是亚流形。 我们得出了Christoffel符号的表达式和大地测量学的张力方程。 这导致大地测量方程表示为二阶微分方程。 我们表明张量微分方程可以转化为矩阵方程。 这些方程依赖于参数模型,但简化为只有两个矢量方程,它们结合了信号的大小和相位以及相对于参数的梯度。 我们计算了两个研究案例的Fisher-Rao距离的闭合形式表达式,并表明子歧管是非大地测量的,表明子歧管内测量的Fisher-Rao距离大于全歧管。
这项工作通过利用Coo等人引入的框架,在量子学习算法的预期概括误差上建立一个新的上限家族,促进了对量子学习的理论理解。 (2024年)和预期真实损失的新定义。 我们的主要贡献是在量子和经典Rényi发散方面推导这些边界,使用用于评估量子Rényi发散的变异方法,特别是Petz和新引入的改良夹层量子Rényi发散。 从分析和数字上,我们展示了使用修改三明治量子雷尼发散的界限与基于Pets发散的界限的优性能。 此外,我们使用两种不同的技术提供概率广义误差边界:一种基于修改的三明治量子雷尼发散和经典雷尼发散,另一种采用平滑最大雷尼发散。
不断收集大量土工技术数据,用于所有土木工程的新项目。 这些数据包括一般的核心和破坏性钻孔,其中采集样本用于实验室测试和原位岩土工程测试。 城市地区的岩土工程数据密度特别高。 这些数据由岩土工程或钻井公司为公共或私人业主收集。 数据对于确定项目的岩土工程条件至关重要,对于地基或地下结构的岩土工程设计显然是必要的。 然而,大多数情况下,数据无法以数字格式访问,并且在项目结束时,数据经常被遗忘,而数据可以重复使用到相邻的项目。 它对技术和科学地球科学界来说是一个巨大的信息和知识损失,它为国家经济带来了巨大的代价。 在法国,BRGM(法国地质调查局)目前正在开发一个新的开放获取平台,致力于岩土工程数据的资本化和可访问性,符合FAIR原则(可查找、可访问、可互操作和可重复使用)。 本文描述了需要克服的挑战和可能的解决方案,考虑到岩土工程测试的高度多样性,解释了保持每个测试的详尽数据集的必要性,并描述了下一阶段的开发。
目前关于物联网对LEO卫星系统的理论研究通常依赖于不切实际的假设,例如无限的陆地区域和全向卫星覆盖,在理论分析中留下了重大差距,以实现更现实的操作限制。 这些限制涉及有限的陆地区域,有限的卫星覆盖,地球曲率效应,整体上行链路和下行链路分析以及链路依赖干扰。 为了解决这些差距,本文提出了一种新的基于随机几何模型,以严格分析物联网超过LEO卫星系统的性能。 通过采用二项式点进程(BPP)而不是传统的Poisson点工艺(PPP),我们的模型准确地表征了有限地面区域中固定数量的物联网设备的地理分布。 该建模框架为从地面物联网设备到卫星(T-S)和从卫星到地面站(S-ES)的链接提供了距离分布功能,同时还考虑了有限的卫星覆盖范围和地球曲率效应。 为了真实地表示通道条件,中加米褪色模型用于T-S链路,以表征不同的小规模褪色环境,而阴影-Rician褪色模型用于S-ES链接,以捕获阴影和主导视线路径的组合效应。 此外,分析还包含上行链路和下行链路干扰,确保系统性能的全面评估。 我们理论框架的正性和有效性通过广泛的蒙特卡洛模拟进行验证。 这些结果为各个链接和整个系统的关键性能指标(如覆盖率概率和平均人体工学率)提供了见解。
对Z类不同组的亚移的研究,如Z^d,d≥2,近年来一直是深入研究的主题。 这些调查揭示了动力学和递归理论之间的显著联系。 关于这些系统动态的不同问题已经用递归理论术语回答。 在这项工作中,我们进一步探索了这种联系。 我们使用可计算分析框架来探索公制空间上有效的动态系统类别,并将这些系统与有限类型(SFT)在组上的子移位联系起来。 我们证明,一般公制空间上的每一个有效的动力系统都是拓扑尺寸为零的有效动力学系统的拓扑因素。 我们将这一结果与现有的模拟结果相结合,以获得作为SFTs因素的系统的新示例 我们还研究一种称为Medvedev度的组子移的共轭不变性。 这种不变性是算法性质的复杂性度量。 我们为任意有限生成组的子移位开发这些度的基本理论。 使用这些工具,我们能够对SFT和几个组上的其他子移类的这种不变值进行排序。 此外,我们建立了这些度与所有子移空间中隔离点的分布之间的联系。 在研究梅德韦杰夫亚移位度的激励下,我们还考虑了图形上的组的翻译类动作。 我们证明每个连接的、局部的有限和无限图形都承认Z的翻译,并且当图形有一两个端时,这个动作可以完全选择过渡。 这概括了 Seward 关于 Z 在有限生成的组上的翻译类操作的结果。
我们提出了提升量子 CSS 代码的拓扑方法。 在之前的工作,我们建议通过在其2D简单复杂表示(称为Tanner cone-complex)上构建覆盖空间来提升CSS代码。 这个想法的灵感来源于Freedman和Hastings的工作,后者将CSS代码与句柄相关联。 在本文中,我们展示了代码的句柄实现也可用于执行代码提升,我们提供了更详细的讨论,说明为什么这本质上等同于Tanner cone-complex方法。 作为一个应用程序,我们通过其手柄实现对超图产品代码的提升进行分类。
未来第六代(6G)系统有望利用极其大规模的多投多投(XL-MIMO)技术,大幅扩展近场区域的范围。 近场中的球面波前特征将额外的自由度(DoFs),即距离和角度)引入通道模型,这导致通道估计(CE)存在独特的挑战。 在本文中,我们提出了一种新的传感增强上链CE方案,用于近场XL-MIMO,这显着减少了所需的基带样本数量和字典大小。 特别是,我们首先提出了一种可以在单个时间段完成的传感方法。 它使用嵌入在天线元件中的功率传感器来测量接收的功率模式,而不是基带样本。 然后提出了一个时间反转算法来精确估计用户和散射器的位置,这提供了更低的计算复杂性。 根据传感的估计位置,然后通过考虑基于近场传输模型的特征-问题提出了一本新的字典,该模型通过更少的基带采样和更轻的字典来促进高效的近场CE。 此外,我们得出了与近场通道矩阵相关的特征向量的一般形式,揭示了它们与离散质球形序列(DPSS)的显着连接。 模拟结果表明,拟议的时间反转算法仅通过功率测量实现准确的定位,并且在计算复杂性方面显着优于各种广泛采用的算法。 此外,拟议的特征词典大大提高了CE的准确性,其字典尺寸紧凑,基带样本大幅减少了66个
我们研究在边缘计算启用的毫米波(mmWave)多用户虚拟现实系统中为360^∘视频流提供多任务边缘用户通信计算资源分配。 为了平衡本文中出现的通信计算权衡,我们制定了一个视频质量最大化问题,将相互依赖的多任务/多用户动作空间和重新缓冲时间/质量变化限制。 我们为多任务速率适应和计算分布(MTRC)制定了深度强化学习框架,以解决感兴趣的问题。 我们的解决方案不依赖于对环境的先验知识,仅使用先前的视频流统计(例如,吞吐量,解码时间和传输延迟)和内容信息,以调整分配的视频比特率和计算分布,因为它在线观察诱导的流性能。 此外,为了捕捉环境中的任务相互依赖性,我们利用神经网络级联将我们的MTRC方法扩展到两个新变体,称为R1C2和C1R2。 我们用真实世界的毫米波网络跟踪和360^∘视频数据集训练所有三种方法,以评估其表现在预期体验质量(QoE)、视口峰值信噪比(PSNR)、回逃时间和质量变化方面。 我们优于最先进的速率适应算法,C1R2显示最佳效果,并实现5.21-6.06 dB PSNR增益,2.18-2.70x回缓冲时间缩短和4.14-4.50 dB质量变异降低。
Thompson Sampling是平衡勘探和开发的原则方法,但其现实世界的采用在大规模或非共轭环境中面临计算挑战。 虽然基于集成的方法提供部分补救措施,但它们通常需要令人望而却步的大集合尺寸。 我们提出了Ensemble++,一个可扩展的探索框架,使用具有随机线性组合的新型共享因子集成架构。 对于线性匪徒,我们提供理论保证,表明Ensemble++实现了与仅Θ(d log T)集成尺寸的精确Thompson Sampling相当的遗憾 - 大大优于先前的方法。 至关重要的是,这种效率适用于紧凑和有限动作集,具有时间不变或时间变化的上下文,而无需更改配置。 我们将这个理论基础扩展到非线性奖励,用可学习的神经表示替换固定特征,同时保留相同的增量更新原则,有效地将理论和实践联系起来。 基于线性、二次、神经和基于GPT的上下文匪徒的综合实验验证了我们的理论发现,并证明了集成 ++ 的卓越后悔计算权衡与最先进的方法。