42digest首页

微分几何研究快报

用 AI 跟踪日新月异的微分几何领域进展

Exploring the Stratified Space Structure of an RL Game with the Volume Growth Transform

使用体积增长变换探索强化学习游戏的分层空间结构

在本研究中,我们探索了为玩特定强化学习(RL)游戏而训练的transformer模型的嵌入空间结构。具体而言,我们研究了基于transformer的近端策略优化(PPO)模型在一个简单环境中的视觉输入嵌入方式,该环境中智能体需要收集"硬币"同时避开由"聚光灯"组成的动态障碍物。通过将Robinson等人研究大语言模型(LLM)的体积增长变换的方法适配到RL场景,我们发现这个视觉硬币收集游戏的token嵌入空间也不是流形,更适合建模为分层空间,其中局部维度可以随点而变化。我们通过证明相当一般的体积增长曲线可以由分层空间实现,进一步强化了Robinson的方法。最后,我们的分析表明,当RL智能体行动时,其潜在表征会在遵循固定子策略的低局部维度时期与实现子目标(如收集物体)或环境复杂度增加(如出现更多障碍物)时的高局部维度爆发之间交替变化。因此,我们的工作表明分层潜在空间中的维度分布可能为RL游戏提供一个新的几何复杂度指标。

代数拓扑学 人工智能 计算几何学
Information geometry of Lévy processes and financial models

Lévy过程与金融模型的信息几何

我们探索了Lévy过程的信息几何。作为起点,我们推导了两个Lévy过程之间的α-divergence。随后,从α-divergence出发,计算了与Lévy过程几何相关的Fisher信息矩阵和α-connection。此外,我们还讨论了这种信息几何的统计应用。作为示例,我们研究了与金融建模相关的各种Lévy过程的微分几何结构,包括tempered stable processes、CGMY模型和variance gamma processes。

统计理论 信息论 微分几何
Central limit theorems for the eigenvalues of graph Laplacians on data clouds

数据云上图拉普拉斯算子特征值的中心极限定理

给定从嵌入欧几里得空间的低维流形M上支撑的分布中采样的i.i.d.样本X_n ={ x_1, …, x_n },我们考虑与X_n上ε-邻近图相关联的图拉普拉斯算子Δ_n,并研究其特征值围绕其均值的渐近波动。特别地,令λ̂_l^ε表示Δ_n的第l个特征值,在数据生成模型和ε衰减速率的适当假设下,我们证明√(n ) (λ̂_l^ε - 𝔼[λ̂_l^ε] )是渐近高斯的,其方差可以明确表征。通过形式论证,我们可以将此渐近方差解释为某种能量梯度流关于Fisher-Rao几何的耗散。这种几何解释反过来使我们能够从统计角度解释该渐近方差,即将其视为估计某些加权拉普拉斯-贝尔特拉米算子特征值的克拉美-罗下界。后一种解释表明了图拉普拉斯算子特征值的一种渐近统计效率形式。我们还提出了多重特征值的中心极限定理,并通过多个数值实验探讨了当我们理论分析中的某些假设放宽时,我们结果的有效性。

机器学习 (统计) 机器学习 偏微分方程分析
Jacobi Hamiltonian Integrators

Jacobi Hamiltonian 集成商

我们开发了一种在Jacobi流形中为Hamiltonian系统构建结构保护集成器的方法。 哈密尔顿力学植根于共音和Poisson几何学,长期以来一直为经典物理学中保守系统建模奠定了基础。 Jacobi流形,概括接触和Poisson流形,扩展了该理论,适合纳入时间依赖,耗散和热力学现象。 在几何集成商的最新进展的基础上 - 特别是Poisson Hamiltonian Integrators(PHI),它保留了Poisson系统的关键特征 - 我们建议建造Jacobi Hamiltonian集成商。 我们的方法探讨了Jacobi和同质Poisson流形之间的对应关系,目的是扩展PHI技术,同时确保保护同质性结构。 这项工作开发了这种概括所需的理论工具,并概述了与Jacobi动力学兼容的数值集成技术。 通过关注同质的Poisson视角,而不是直接接触实现,我们为Jacobi框架内的时间依赖和耗散系统的结构保护集成提供了明确的途径。

微分几何 数值分析 数学物理
Higher Gauge Flow Models

更高的测量流量模型

本文介绍了更高测量流模型,生成流模型的一类新颖。 基于普通测量流模型(arXiv:2507.13414),这些更高的测量流模型利用L_∞代数,有效地扩展了谎言代数。 这种扩展允许将较高的几何形状和与较高组相关的较高对称性集成到生成流模型的框架中。 高斯混合模型数据集的实验评估显示,与传统流模型相比,性能显著提高。

人工智能 机器学习 微分几何

最新研究

Lévy过程与金融模型的信息几何

我们探索了Lévy过程的信息几何。作为起点,我们推导了两个Lévy过程之间的α-divergence。随后,从α-divergence出发,计算了与Lévy过程几何相关的Fisher信息矩阵和α-connection。此外,我们还讨论了这种信息几何的统计应用。作为示例,我们研究了与金融建模相关的各种Lévy过程的微分几何结构,包括tempered stable processes、CGMY模型和variance gamma processes。

统计理论信息论微分几何概率论
arXiv

利基群的基于动力的梯度下降方法

Polyak 的重球( PHB ; Polyak ,1964年), a . k . a 。 古典动量,和内斯特罗夫的加速梯度(NAG; Nesterov,1983)是完善的动力下降优化方法。 虽然后者通常优于前者,但文献中尚未充分探讨将PHB方法对非线性空间进行概括。 在本文中,我们提出了类似NAG的方法的 Lie 组优化的概括。 这种概括基于经典和加速动量方法之间的一对一变化对应(Campos等人,2023)。 我们根据Frobenius规范和Rosenbrock函数为旋转组的选择回缩提供数值实验,以证明我们提出的方法的有效性,并与欧几里得案例的结果一致,即NAG更快的收敛率。

最优化与控制机器学习数值分析微分几何
arXiv

指标卷积:适应图像卷积的统一理论

标准卷积在图像处理和深度学习中普遍存在,但它们的固定内核限制了适应性。 参考内核网格的几种变形策略已经提出。 然而,他们缺乏统一的理论框架。 通过回到图像的度量视角,现在被视为配备局部和大地测量距离概念的二维流形,无论是对称(Riemannian)还是(Finsler),我们提供了一个统一的原则:内核位置是隐式指标的单位球的样本。 通过这种新视角,我们还提出了公制卷积,这是一种从显式信号依赖性指标中采样单元球的新方法,为可解释的运算符提供几何正则化。 这个框架与基于梯度的优化兼容,可以直接取代应用于输入图像或神经网络深度特征的现有卷积。 微量卷积通常需要更少的参数并提供更好的泛化。 我们的方法在标准去噪和分类任务中表现出竞争力。

计算机视觉与模式识别微分几何
arXiv

数据云上图拉普拉斯算子特征值的中心极限定理

给定从嵌入欧几里得空间的低维流形M上支撑的分布中采样的i.i.d.样本X_n ={ x_1, …, x_n },我们考虑与X_n上ε-邻近图相关联的图拉普拉斯算子Δ_n,并研究其特征值围绕其均值的渐近波动。特别地,令λ̂_l^ε表示Δ_n的第l个特征值,在数据生成模型和ε衰减速率的适当假设下,我们证明√(n ) (λ̂_l^ε - 𝔼[λ̂_l^ε] )是渐近高斯的,其方差可以明确表征。通过形式论证,我们可以将此渐近方差解释为某种能量梯度流关于Fisher-Rao几何的耗散。这种几何解释反过来使我们能够从统计角度解释该渐近方差,即将其视为估计某些加权拉普拉斯-贝尔特拉米算子特征值的克拉美-罗下界。后一种解释表明了图拉普拉斯算子特征值的一种渐近统计效率形式。我们还提出了多重特征值的中心极限定理,并通过多个数值实验探讨了当我们理论分析中的某些假设放宽时,我们结果的有效性。

机器学习 (统计)机器学习偏微分方程分析微分几何
arXiv

Grassmann流形曲率的简单矩阵表达式

我们证明了将Grassmann流形建模为对称正交矩阵Gr(k,ℝ^n) ≅{Q ∈ℝ^n × n : Q^𝖳 Q = I, Q^𝖳 = Q, tr(Q)=2k - n}能为各种内蕴和外蕴曲率及曲率相关量提供极其简单的矩阵公式。这些包括黎曼、里奇、雅可比、截面、标量、平均、主曲率和高斯曲率;肖顿、外尔、科顿、巴赫、普莱班斯基张量,共曲率、非度量性和挠率张量;第一、第二和第三基本形式;高斯和魏因加滕映射;以及上、下δ不变量。我们将针对上述量推导出基于标准矩阵运算的显式简单表达式,这些表达式可通过数值线性代数稳定计算。其中许多量此前从未在Grassmann流形中被提出过。

微分几何数值分析最优化与控制
arXiv

使用体积增长变换探索强化学习游戏的分层空间结构

在本研究中,我们探索了为玩特定强化学习(RL)游戏而训练的transformer模型的嵌入空间结构。具体而言,我们研究了基于transformer的近端策略优化(PPO)模型在一个简单环境中的视觉输入嵌入方式,该环境中智能体需要收集"硬币"同时避开由"聚光灯"组成的动态障碍物。通过将Robinson等人研究大语言模型(LLM)的体积增长变换的方法适配到RL场景,我们发现这个视觉硬币收集游戏的token嵌入空间也不是流形,更适合建模为分层空间,其中局部维度可以随点而变化。我们通过证明相当一般的体积增长曲线可以由分层空间实现,进一步强化了Robinson的方法。最后,我们的分析表明,当RL智能体行动时,其潜在表征会在遵循固定子策略的低局部维度时期与实现子目标(如收集物体)或环境复杂度增加(如出现更多障碍物)时的高局部维度爆发之间交替变化。因此,我们的工作表明分层潜在空间中的维度分布可能为RL游戏提供一个新的几何复杂度指标。

代数拓扑学人工智能计算几何学机器学习
arXiv

Jacobi Hamiltonian 集成商

我们开发了一种在Jacobi流形中为Hamiltonian系统构建结构保护集成器的方法。 哈密尔顿力学植根于共音和Poisson几何学,长期以来一直为经典物理学中保守系统建模奠定了基础。 Jacobi流形,概括接触和Poisson流形,扩展了该理论,适合纳入时间依赖,耗散和热力学现象。 在几何集成商的最新进展的基础上 - 特别是Poisson Hamiltonian Integrators(PHI),它保留了Poisson系统的关键特征 - 我们建议建造Jacobi Hamiltonian集成商。 我们的方法探讨了Jacobi和同质Poisson流形之间的对应关系,目的是扩展PHI技术,同时确保保护同质性结构。 这项工作开发了这种概括所需的理论工具,并概述了与Jacobi动力学兼容的数值集成技术。 通过关注同质的Poisson视角,而不是直接接触实现,我们为Jacobi框架内的时间依赖和耗散系统的结构保护集成提供了明确的途径。

微分几何数值分析数学物理辛几何
arXiv

OGRePy:面向对象的Python通用相对论包

OGRePy是一个现代的开源Python软件包,旨在执行符号张量计算,特别关注广义相对论中的应用程序。 OGRePy建立在面向对象的架构上,将张量、指标和坐标系封装为自包含的对象,自动处理索引的提升和降低,协调变换、收缩、部分或协变衍生物以及所有张量运算。 通过利用SymPy和Jupyter Notebook的功能,OGRePy提供了一个强大的,用户友好的环境,促进了广义相对论和微分几何的研究和教学。 这个Python包再现了流行的Mathematica包OGRe的功能,同时通过使用Python的原生面向对象语法对其进行了很大的改进。 在本文中,我们描述了OGRePy的设计和实施,并讨论了其在数学和物理学的研究和教育中重复使用的潜力。

广义相对论与量子宇宙学数学软件符号计算微分几何
arXiv

将亚当与操纵物进行高效训练变形金刚

神经网络成功背后的主要原因之一是出现了一系列新的,高度成功的优化器,也许最重要的是Adam优化器。 它被广泛用于训练神经网络,但众所周知很难解释。 缺乏清晰的物理直觉,亚当很难概括为流形。 已经尝试将Adam算法的部分直接应用于歧管或找到底层结构,但完全的概括仍然难以实现。 在这项工作中,提出了一种新的方法,利用与优化神经网络相关的歧体的特殊结构,例如Stiefel歧体,共体Stiefel歧体和Grassmann歧体:所有这些都是同质空间,因此承认一个全局切线空间表示 - 一个共同的向量空间(Lie子空间),其中所有切线空间都可以很容易地表示。 这种全局切线空间表示用于执行 Adam 优化器中的所有步骤,我们能够在没有投影步骤的情况下将优化器完全推广到歧管。 然后,将生成的算法应用于训练变压器,其中正交约束被强制到机器精度,并在训练过程中观察到显着的加速。

机器学习微分几何
arXiv

更高的测量流量模型

本文介绍了更高测量流模型,生成流模型的一类新颖。 基于普通测量流模型(arXiv:2507.13414),这些更高的测量流模型利用L_∞代数,有效地扩展了谎言代数。 这种扩展允许将较高的几何形状和与较高组相关的较高对称性集成到生成流模型的框架中。 高斯混合模型数据集的实验评估显示,与传统流模型相比,性能显著提高。

人工智能机器学习微分几何
arXiv

内蕴黎曼近端梯度方法在凸优化中的应用

我们研究了一类在Hadamard流形上的(可能强)测地凸优化问题,其中目标函数可分解为一个光滑函数和一个可能非光滑函数的和。我们提出了一种内蕴凸黎曼近端梯度(CRPG)方法,该方法在非光滑步骤中使用流形近端映射,而无需在嵌入空间或切空间中操作。我们建立了凸问题的次线性收敛速率和强凸问题的线性收敛速率,并推导了推广欧几里得情形的基本近端梯度不等式。我们在双曲空间和对称正定矩阵流形上的数值实验表明,该方法相比现有方法具有显著的计算优势。

最优化与控制数值分析微分几何
arXiv

极小水平triods:分析与计算

本文研究了在Heisenberg群中连接三个给定点的极小长度网络配置问题。在证明了(可能退化的)极小水平triods的存在性后,我们研究了它们的特征刻画。随后,我们提出了一种水平曲线缩短流,可将任何合适的初始triod变形为长度泛函的临界点。基于稳定的全离散有限元格式的数值实验,为我们提供了对这一亚黎曼几何丰富景观的有益见解。

偏微分方程分析数值分析微分几何
arXiv

GeoHNNs:几何汉密尔顿神经网络

物理学的基本定律本质上是几何的,通过对称和守恒的原理来决定系统的演变。 虽然现代机器学习为从数据中建模复杂动力学提供了强大的工具,但常见的方法通常忽略了这种底层几何结构。 例如,物理信息神经网络可能违反基本的物理原理,导致长期不稳定的预测,特别是对于高维和混沌系统。 在这里,我们介绍了几何汉密尔顿神经网络(GeoHNN),这是一个通过明确编码物理定律固有的几何前序来学习动力学的框架。 我们的方法强制执行两个基本结构:惰性的黎曼几何,通过参数化惯性矩阵在其对称正-定矩阵的自然数学空间中的惯性矩阵,以及相位空间的共性几何,使用受约束的自动机来确保在减少的潜在空间中保存相位空间体积。 我们通过从耦合振荡器到高维可变形物体的系统实验证明,GeoHNN明显优于现有模型。 它实现了卓越的长期稳定性,准确性和能量守恒,证实嵌入物理学的几何学不仅仅是一个理论吸引力,而是创建物理世界强大和可推广的模型的实际必要性。

机器学习微分几何动力系统辛几何
arXiv

平行运动机械手逆动力学的递归时间衍生物的递归 Lie-Group配方

系列弹性执行器(SEA)被引入用于串行机械臂。 他们基于模型的轨迹跟踪控制需要逆动力学解决方案的第二次衍生物,为此提出了算法。 尚未对配备SEA的平行运动力学(PKM)进行轨迹控制。 关键因素是对逆动力学解决方案第二次衍生物的计算效率评估。 这在文献中尚未提出,并且首次在本文件中讨论。 PKM的特殊拓扑结构被利用回传算法来评估串行机器人的逆向动力学。 使用谎言组的公式,所有的关系都在这个框架内衍生。 对于6-DOF Gough-Stewart平台(作为外骨骼的一部分)以及应用基于平整的控制方案时,为平面PKM提供数值结果。

机器人学数值分析微分几何动力系统
arXiv

RiemannLoRA:一个统一的黎曼框架,用于无模数的LoRA优化

低等级适应(LoRA)已成为广泛采用的大型语言模型(LLM)的参数高效微调标准,显着降低了内存和计算需求。 然而,挑战依然存在,包括找到最佳初始化策略或减轻低等级矩阵因子化的过度参数化。 在这项工作中,我们提出了一种新的方法,在统一的框架内同时解决这两个挑战。 我们的方法将一组固定等级的LoRA矩阵视为光滑的歧义。 将适配器视为此歧体上的元素可消除过度参数化,同时确定沿歧头的最快损耗减少的方向提供初始化。 特别注意获得我们的方法的数值稳定和计算效率的实现,使用数值线性代数和黎曼优化的最佳实践。 关于LLM和扩散模型架构的实验结果表明,RiemannLoRA与标准LoRA及其最先进的修改一致提高了收敛速度和最终性能。

机器学习计算与语言数值分析微分几何
arXiv

使用机器学习在球体上搜索Z/2特征函数

我们使用机器学习在2个球体上搜索Z/2特征函数的例子。 为此,我们创建了一个多值版本的前馈深度神经网络,我们使用JAX库实现了它。 我们为三种情况发现了Z/2特征函数:在前两种情况下,我们分别在四面体和立方体的顶点固定了分支点。 在第三个案例中,我们允许AI移动分支点,最终,它将分支点定位在压扁的四面体的顶点。

微分几何机器学习数值分析
arXiv

可计算动力系统中的普适性:经典与新近

自计算概念诞生之初,计算模型与动力学之间的关系就一直吸引着数学家和计算机科学家。最近,由于陶哲轩(T. Tao)提出通过嵌入式计算模型寻找纳维-斯托克斯方程爆破解的研究计划,这一关联重新获得关注。本综述论文回顾了近期一些通过动力系统表征可计算性的新颖研究视角。从经典意义上的动力普适性出发,我们将探讨流体力学中的图灵普适性现代概念,以及作为通过动力边界理论系统表征可计算函数方法的Topological Kleene Field Theories。最后,我们将讨论该领域一些重要的开放性问题。

动力系统形式语言与自动机理论微分几何
arXiv

刚性身体系统运动方程的封闭形式时间衍生物

描述刚体系统动力学的运动方程(EOM)的衍生物对机器人社区越来越相关,并在机器人系统的设计和控制中发现了许多应用。 控制机器人,特别是包括弹性组件的多体系统,不仅需要平滑的轨迹,还需要控制力/转子的时间衍生物,因此需要EOM。 本文以封闭形式呈现EOM的时间导数,最高为二阶,作为现有递归算法的替代配方,为衍生物的结构提供了直接的见解。 用于刚体系统的Lie组配方可产生非常紧凑且易于参数化的方程。

机器人学数值分析微分几何动力系统
arXiv

瓷砖表面

我们定义了一类C^k-regular曲面,k ≥ 1,可平整曲面,通过有限数量的共通类瓷砖来接受几何瓷砖。 我们展示了如何构建许多示例,并检查与平面和球体的众所周知的平铺层以及单面多面的关系。

微分几何计算几何学组合数学
arXiv

模型压缩中的信息几何和迭代优化:操作员因子化

深度学习模型的参数计数不断增加,需要有效的压缩技术,以便在资源受限的设备上部署。 本文探讨了信息几何的应用,对参数空间的密度诱导指标的研究,以分析模型压缩空间内的现有方法,主要侧重于操作员因子化。 采用这一视角突出了核心挑战:定义一个最优的低计算子歧管(或子集)并投射到它上面。 我们认为,许多成功的模型压缩方法可以被理解为暗示近似此投影的信息差异。 我们强调,在压缩预训练模型时,使用信息差异对于提高零拍摄精度至关重要,但在模型微调时可能不再如此。 在这种情况下,瓶颈模型的可训练性对于实现高压缩比和最小的性能下降更为重要,因此需要采用迭代方法。 在这种情况下,我们证明了迭代奇异值阈值的融合,用于训练受软等级约束的神经网络。 为了进一步说明这一视角的实用性,我们展示了如何通过更柔和的等级降低对现有方法的简单修改,从而在固定压缩率下提高性能。

机器学习微分几何最优化与控制
arXiv