随着深度学习和大型语言模型中快速发现新兴现象,解释和理解它们的原因已成为迫切需要。 在这里,我们提出了一个严格的熵力理论,用于理解用随机梯度下降(SGD)训练的神经网络的学习动力学及其变体。 基于参数对称性和熵损失景观的理论,我们表明,表征学习受到随机性和离散时间更新产生的新兴熵力至关重要。 这些力系统地打破连续的参数对称并保存离散的参数对称性,导致一系列梯度平衡现象,类似于热系统的装备特性。 反过来,这些现象(a)解释了AI模型之间神经表征的普遍对齐,并导致柏拉图表征假说(b)调和深度学习优化的尖锐和扁平化行为看似矛盾的观察。 我们的理论和实验表明,熵力和对称断裂的结合是理解深度学习中新兴现象的关键。
从反向散射远场数据中恢复异常是逆散射理论中长期存在的开放问题。 我们朝着这个方向迈出了第一步,通过从反散远场测量中确定凸不平的障碍的独特可识别性。 具体来说,我们证明凸障碍物的边界和边界条件都是由所有频率的背散方向测量的远场模式唯一确定的。 关键工具是Majda对高频机制中远场模式的渐近估计。 此外,我们引入了一个快速稳定的数值算法,用于重建边界和计算边界条件。 该算法的一个关键特征是,即使边界不为已知,也可以计算边界条件,反之亦然。 数字实验证明了拟议算法的有效性和稳健性。
我们评估受大变形和磁场影响层层磁弹性半空间的表面稳定性条件。 在回顾了欧莱西亚和拉格朗日形式的磁静方程的基本度量和总结后,我们从依赖于变形梯度和拉格朗日磁感应的总能量函数中得出了构成关系。 能量原理产生平衡方程、磁场方程和边界条件。 能量功能的第二个变化为稳定性分析提供了增量方程和条件。 表面不稳定性是通过在磁场正常到表面的磁场下对有限变形状态的线性化增量和磁感应来研究的。 考虑四个说明性案例:(i) 分层不可磁化半空间,具有不同的刚度对比度;(二) 磁弹性半空间作为磁感应功能的关键拉伸;(iii) 磁敏层在不可磁基板上的表面稳定性;(iv) 双层磁弹性固体中的分叉条件,具有不同的刚度比。 图形结果贯穿始终。
我们考虑使用多预调理,它允许在高频亥姆霍兹问题上并行应用多个预置器。 典型的应用存在具有挑战性的稀疏线性系统,这些系统是复杂的非赫米蒂安,并且由于污染效应,要么非常大,要么仍然很大,但在物理学方面解决不足。 这些因素使得寻找通用,高效和可扩展的求解器变得困难,没有一种方法成为明确的选择方法。 在这项工作中,我们从被称为扫地方法的域分解策略中获得灵感,这些策略因其产生近线性渐近复杂性的能力而获得了显着的兴趣,并且也可以对高频问题有利。 虽然存在成功的方法,例如基于高阶接口条件,完美匹配的层(PML)或波前的复杂跟踪方法,但它们通常可以非常参与或繁琐地实现。 我们在这里研究使用简单的扫地技术应用于不同的方向,然后可以并行地纳入多预置的GMRES策略。 关于二维基准问题的初步数值结果将证明这种方法的潜力。
随着深度学习和大型语言模型中快速发现新兴现象,解释和理解它们的原因已成为迫切需要。 在这里,我们提出了一个严格的熵力理论,用于理解用随机梯度下降(SGD)训练的神经网络的学习动力学及其变体。 基于参数对称性和熵损失景观的理论,我们表明,表征学习受到随机性和离散时间更新产生的新兴熵力至关重要。 这些力系统地打破连续的参数对称并保存离散的参数对称性,导致一系列梯度平衡现象,类似于热系统的装备特性。 反过来,这些现象(a)解释了AI模型之间神经表征的普遍对齐,并导致柏拉图表征假说(b)调和深度学习优化的尖锐和扁平化行为看似矛盾的观察。 我们的理论和实验表明,熵力和对称断裂的结合是理解深度学习中新兴现象的关键。
从反向散射远场数据中恢复异常是逆散射理论中长期存在的开放问题。 我们朝着这个方向迈出了第一步,通过从反散远场测量中确定凸不平的障碍的独特可识别性。 具体来说,我们证明凸障碍物的边界和边界条件都是由所有频率的背散方向测量的远场模式唯一确定的。 关键工具是Majda对高频机制中远场模式的渐近估计。 此外,我们引入了一个快速稳定的数值算法,用于重建边界和计算边界条件。 该算法的一个关键特征是,即使边界不为已知,也可以计算边界条件,反之亦然。 数字实验证明了拟议算法的有效性和稳健性。
用于流体流动和流体结构相互作用模型的浸入式接口方法(IIM)施加了跳跃条件,捕获沿浸入边界集中的力量产生的应力不连续性。 大多数使用IIM进行流体动力学应用的前期工作都集中在平滑的界面上,但具有角和边缘等锐利特征的边界可以出现在实际分析中,特别是在工程结构上。 本研究建立在我们的工作基础上,将接口几何形状的有限元素类型表示与IIM集成。 这种方法的初始实现使用了边界的连续Galerkin(CG)有限元离散化,但正如我们在这里所展示的那样,这些方法在接近尖锐的几何特征时会产生很大的误差。 为了克服这个困难,本研究引入了一种IIM方法,使用不连续的Gaerkin(DG)表示跳跃条件。 数字示例探讨了不同接口表示对平滑和锐利边界精度的影响,特别是与固定接口配置交互的流。 我们证明,使用DG方法提供与CG方法相当的平滑情况的准确性。 此外,我们确定了与几何形状的锐度直接相关的 CG 表示的时间步长限制。 相比之下,DG表示施加的时间步长限制被证明对锐利特征的存在不敏感。
我们提出了一个统一的量子电路经典模拟框架,称为Quon经典模拟(QCS),建立在Quon语言的示意形式主义之上。 这个框架的核心是引入魔法孔,这是一个拓扑特征,捕获了模拟量子系统计算硬度的全球来源。 与传统措施不同,QCS的复杂性由与这些魔法洞相关的拓扑纠缠熵控制。 我们证明克利福德电路和火柴门电路没有魔法孔,因此在我们的模型中有效地模拟。 为了捕捉魔法孔的交互结构,我们定义了拓扑张量网络表示,并开发了新颖的骨骼关系和还原算法,以简化电路表示。 这种方法显著提高了经典模拟的效率,并为各种已知量子电路类的可操作性提供了统一的解释。 我们的工作为量子系统和拓扑复杂性的经典可仿真性提供了新的拓扑视角。
介绍了通过基于子空间的方法近似自相邻运算符特征值的数学框架。 该框架包含光谱不等式,这些不等式扩展到无边界运算符,并解释多个错误来源。 我们包括概念性评论,关于这种框架如何解决当代挑战,以实现更完整的量子物理学近似理论。 进一步的分析考虑了子空间方法的计算操作,并提出了新的数值实践。 特别是,在噪声存在的情况下对光谱子空间的维度检测引入分析保证。 该框架的普遍性邀请应用于广泛的数值方法,其效用通过信号处理的最新进展得以证明。
在本文中,我们介绍了重整化组(RG)方法的修改版本,并测试其数值精度。 它已经在许多标量ODE和ODE系统上进行了测试。 我们的方法主要是出于简化振幅方程的可能性。 我们方法的关键特征是在扰动层次结构的每个顺序中引入一个新的同质函数,然后用于从振幅方程中删除术语。 我们已经证明,有多少术语可以被删除是有限度的,因为超过某一点的这样做将重新引入线性增长。 因此,振幅方程中有一个核心,它由在避免线性增长的同时无法删除的术语组成。 使用我们修改的RG方法,在保持振幅方程中相同复杂度的同时,也可以实现更高的精度。
我们考虑求解二维和三维时变对流-扩散偏微分方程 (PDEs) 的自适应秩积分。我们采用标准的有限差分方法进行空间离散化,并与对角隐式 Runge-Kutta 时间方案相结合。离散方程是一个广义 Sylvester 方程 (GSE),我们使用一种基于三个关键策略的自适应秩算法来求解:(i) 基于扩展 Krylov 策略构建维度方向子空间,(ii) 开发用于降阶系数矩阵的有效预条件器,以及 (iii) 在不显式回归到全秩形式的情况下,有效地计算方程的残差。二维中使用 SVD 进行低秩分解,三维中使用高阶 SVD (HOSVD) 将张量表示为压缩的 Tucker 格式。数值结果表明,所提出方法的计算复杂度与常系数情况[El Kahza et al, J. Comput. Phys., 518 (2024)] 相当,对于 d 维问题(此处,d = 2 或 3),其复杂度为 𝒪(N r^2 + r^d+1),其中 N 是一维分辨率,r 是 Krylov 迭代期间的最大秩(我们发现它在很大程度上独立于 N)。我们提供数值示例,说明我们算法的计算效率和复杂度。
机器学习已经成为增强数据同化的强大工具。 虽然监督学习仍然是标准方法,但强化学习(RL)通过其顺序决策框架提供了独特的优势,这自然符合数据同化的特征,通过动态平衡模型预测和观测。 我们开发了RL-DAUNCE,这是一种基于RL的新方法,通过三个关键方面增强了数据与物理约束的同化。 首先,RL-DAUNCE继承了机器学习的计算效率,同时它独特地构建了其代理,以镜像传统数据同化方法中的集成成员。 其次,RL-DAUNCE强调不确定性量化,通过推进多个集成成员,超越简单的均态优化。 第三,RL-DAUNCE的集成作为代理设计有助于在同化过程中执行物理约束,这对于改善状态估计和后续预测至关重要。 开发了原始双重优化策略来强制执行约束,从而动态地惩罚奖励功能,以确保在整个学习过程中的约束满意度。 此外,状态变量边界通过限制 RL 操作空间受到尊重。 这些功能共同确保了物理一致性,而不会牺牲效率。 RL-DAUNCE应用于Madden-Julian涛动,这是一种间歇性大气现象,其特征是强烈的非高斯特征和多种物理约束。 RL-DAUNCE优于标准集成Kalman过滤器(EnKF),由于违反物理约束而灾难性地失败。 值得注意的是,RL-DAUNCE与受限EnKF的性能相匹配,特别是在恢复间歇信号,捕获极端事件和量化不确定性方面,同时需要更少的计算工作。
量子高斯通道是连续可变量子系统中通信和信息处理的基本模型。 这项工作涉及这些渠道的基础方面和物理实现途径。 首先,我们提供了一个严格的统一框架,正式证明了文献中普遍存在的量子高斯通道的三个主要定义的等效性,巩固了理论理解。 其次,我们使用多端口干涉仪(量子光学的关键平台)研究这些通道的物理实现。 核心研究贡献是通道参数的精确表征,对应于通过线性光学多端口干涉仪物理实现的高斯通道。 这种表征将抽象的数学描述与具体的物理架构联系起来。 一路上,我们也解决了Parthasarathy(Indian J.)提出的一些问题。 纯粹的Appl。 数学。 46,(2015年)。
开发了一种解决一维狄拉克方程的逆光谱问题的方法。 该方法基于Gelfand-Levitan方程和傍嗦-Legendre序列扩展的变变内核。 获得方程的线性代数系统,可以用数值求解。 据我们所知,这是解决在有限区间内一维狄拉克方程的逆问题的第一个实用方法。
我们推广量子CUSUM(QUSUM)算法,用于最快的变化点检测,由Fanizza,Hirche和Calsamiglia(Phys)在有限维度分析。 Rev. 莱特。 131,02602,2023),到无限维量子系统。 我们的分析依赖于Hayashi(Hayashi,J.)对结果的新概括。 Phys。 A:数学。 将军。 34, 3413, 2001) 关于量子相对熵的渐近性,我们建立为无限维设置。 这使我们能够证明QUSUM策略保留了其渐近最优性,其特征是预期检测延迟与任何具有有限相对熵状态的一对状态的平均误报警时间之间的关系。 因此,我们的发现广泛适用,包括连续可变系统(例如高斯语态),促进量子光学和其他物理平台中优化的换点检测方案的开发,并使实验验证可行。
量化准备量子态和实施量子过程所需的最小纠缠是量子信息理论的关键挑战。 在这项工作中,我们开发了量子运算下的纠缠成本的可计算和忠实的下界,完全保留了部分转置(PPT操作)的正向性,通过引入k-负率的广义发散,即对数负性的概括。 我们的界限是通过半明确的方案拟订有效地计算出来的,并为所有非《不扩散条约》的国家提供非平凡的价值,确立了对《不扩散条约》纠缠的资源理论的忠诚。 值得注意的是,我们发现并肯定了在PPT操作下对全随机纠缠状态的无症状纠缠操纵的不可逆转性。 此外,我们扩展了我们的方法,以得出点对点和双部分量子通道的纠缠成本的下限。 我们的绑定展示了对各种量子态和通道的先前已知可计算边界的改进。 这些发现推动了理解纠缠结构和纠缠操纵的基本极限的界限。
在这项工作中,我们证明了与夹层Rényi差异相关的熵量的统一连续性边界,例如夹层Rényi条件熵。 我们遵循三种不同的方法:第一个是“几乎添加方法”,它利用了发散指数的亚/超累性和联合凹凸/凸度。 在我们的第二种方法中,称为“运营商空间方法”,我们将熵措施作为规范表达,并利用它们的特性来建立界限。 这些规范从插值空间规范中汲取灵感。 我们只展示了仅依靠矩阵分析工具的规范属性,而且还将其适用性扩展到与资源理论相关的上下文。 通过这种方式,我们扩展了Marwah和Dupuis以及Beigi和Goodarzi在夹层Rényi条件熵环境中使用的策略。 最后,我们将方法合并为具有一些优势属性的混合方法,然后讨论每个绑定的子句都表现最佳。 我们的结果比以前的最佳连续性边界有所改善,有时甚至提供了第一个可用的连续性限制。 在一个单独的贡献中,我们使用一些作者在上一篇文章中开发的ALAFF方法来研究近似量子马尔可夫链的稳定性。
我们严格分析贝叶斯最佳设置中任意深度的全训练神经网络,在所谓的比例缩放方案中,输入的训练样本和宽度的数量和所有内层按比例分配。 我们证明了贝叶斯深度神经网络模型之间的信息理论等价物,该模型由具有匹配架构的教师生成的数据训练,以及广义线性模型中最优推理的更简单模型。 这种等价性使我们能够计算该机制中深度神经网络的最佳概括误差。 因此,我们证明了崔等人所猜想的“深高斯等价原理”。 (2023 ) (arXiv:2302.00375 ) 。 我们的结果强调,为了逃避深度神经网络(在还原到线性模型的意义上)在强烈过度参数化的比例方案中发生的这种“琐碎化”,必须考虑从更多数据中训练的模型。
封装的量子态是度量不变态,其中所有内部量子数(IQN)形成一个不可分割的块。 这一特征产生了新的包装纠缠,包括所有IQN,这对基础物理学和量子技术都很重要。 在这里,我们开发了一个基于封装量子态的度量不变量子信息处理框架。 我们为单个粒子和多粒子的有效包装叠加状态提出了必要和充分的条件。 然后,我们介绍了构建仪表不变的打包量子比特(或量子比特)、封装闸门和打包电路(与总充电运营商一起通勤)的细节。 这些是量表不变量子信息科学的替代基础。 然后,我们将传统的量子纠错代码、量子算法和量子通信协议调整为(d×D)维混合封装子空间。 这种高维混合封装子空间对于修剪和缩放具有灵活性,可与可用的物理系统相匹配。 因此,打包的量子信息处理变得可行和可测试。 我们的结果表明,测量不变的量子态可能为稳健、容错和安全的量子技术提供一条可能的途径。
本文侧重于具有空间电荷限制的真空二极管的固定自密磁绝缘问题,由尺寸1.5的异常扰动的Vlasov-Maxwell系统描述。 当电子向点 x^* 的阴极偏转时,绝缘二极管的情况被认为是。 首先,初始VM系统被简化为ODE的非线性单数极限系统,用于电场和磁场的电位。 第二步涉及极限系统对有效潜力Θ(x)的新非线性单数ODE方程的还原。 非负解的存在证明在区间[0, x^*) 中的最后一个方程,其中 Θ(x)>0。 最有趣和未探索的案例是在间隔(x^*, 1]上Θ(x)<0,对应于绝缘二极管的情况。 第一次考虑根据参数和 Θ(x)<0 边界条件对绝缘二极管中溶液的复杂分叉进行数值分析。 构建了溶液Θ(x)对自由点(自由边界)的依赖的分叉图。 x^* 发现绝缘二极管间距。
我们考虑计算Kortweg-de Vries方程的一类单体气体原电位的问题,该方程产生于在物理域的无限间隔上积累,延伸到 -∞。 这种积累导致一个相关的黎曼 - 希伯特问题在一些不连接的间隔。 在跳高矩阵具有特定的平方根行为的情况下,我们描述了一种高效和准确的数值方法,以解决黎曼 - 希伯特问题并提取潜力。 该方法的关键是,首先,黎曼 - 希伯特问题的变形,使数值使用所谓的g函数,其次,将端点奇点纳入选择的基础,以离散和解决相关的奇异积分方程。
我们描述了在[Lett]中提出的AFW技术的高级版本。 数学。 Phys., 113, 121 (2023)],[Lobachevskii J. Math., 44(6), 2169 (2023)],它使我们能够获得较低的半连续性边界,连续性边界和量子系统特征的局部下界和离散随机变量。 我们考虑将新版AFW技术应用于量子系统的几个基本特征(冯·诺依曼熵、能量型功能、量子相对熵、条件熵和形成的纠缠)。