42digest首页

最新研究

TokenBlowUp:通过Monoidal变换解决LLM令牌空间中的代表性奇点

最近的工作提供了令人信服的证据,挑战了大型语言模型(LLM)的令牌嵌入空间的基本多方面假设。 这些发现揭示了多云代币周围存在几何奇点,这可能导致代表性不稳定。 现有方法以平稳的数据流形为前提,无法解决这些内在的结构缺陷。 在本文中,我们用方案理论的语言正式化了这个问题,并通过在每个奇异点应用方案理论的爆发来提出严格的解决方案。 这个过程取代了环境亲和方案中的一个奇异点,其特殊的除数,我们将其标识为规范几何空间 - 一个方向的投射空间 - 容纳令牌的模糊语义含义。 这个“代表性脱语”的过程为嵌入构建了一个新的几何景观。 我们证明了一个形式定理,保证这个新空间的几何正则化,表明原始病理已经解决。 最后,我们概述了框架的架构含义,主张从静态查找到动态的几何基础计算范式转变。

代数几何机器学习
arXiv

轨道关闭和矩阵组的确定问题

矩阵组作用下点轨道的计算问题贯穿整个计算机科学,包括程序分析,复杂性理论,量子计算和自动机理论。 在许多情况下,重点超出了轨道,在适当的拓扑结构下关闭轨道。 通常,一个从一个组和一组点开始,并询问有关该组作用下设置的轨道关闭的问题,例如,是否两个给定的轨道闭合相交。 在本文中,我们考虑了我们所说的矩阵群和轨道关闭的确定问题的集合。 这些问题始于一个给定的品种,并寻求了解它是否以及如何作为代数矩阵组或作为轨道闭合体产生。 问题如何询问底层组是否生成,这意味着它是由给定数字 s 的矩阵在拓扑上生成的。 在其他应用中,这种类型的问题最近在合成循环的背景下进行了研究,这些循环受制于程序变量上的某些指定不变性。 我们的主要结果是多项式空间过程,它输入一个品种和一个数字,并确定给定的品种是否作为在 s 生成的交换代数矩阵基团下的一个点的轨道闭合而产生。 我们的方法中的主要工具是交换代数矩阵组和模块理论的结构特性。 我们留下了一个问题,即确定一个变量是否是一个在 s 生成的代数矩阵组下的一个点的轨道闭合(没有对数的要求)。

计算复杂性代数几何
arXiv

关于n-正确集的极大曲线

假设𝒳是平面上的一个n-正确集节点集,即它允许使用总次数小于或等于n的二元多项式进行唯一可解插值。那么,次数k≤ n的代数曲线q最多可以通过d(n,k)个节点,其中d(n,k)=n+22-n+2-k2。如果次数k≤ n的曲线q恰好通过d(n,k)个节点,则称其为极大曲线。特别地,极大直线是通过𝒳的d(n,1)=n+1个节点的直线。极大曲线是研究n-正确集的重要工具。我们提出了极大曲线的新性质,以及对已知性质的扩展。

数值分析代数几何
arXiv

在维度 4 和加密应用中快速计算 2 异构

Dimension 4 isogenies首先在密码学中引入,用于超奇数Isogeny Diffie-Hellman(SIDH)的密码分析,并已被建设性地用于几个方案,包括SQIsignHD,这是基于SQIsign的签名方案的衍生物。 与尺寸2和维度3不同,我们不能再依赖Jacobian模型及其衍生物来计算异构性。 在维度4(及更高)中,我们只能使用 theta-models。 Romain Cosset,David Lubicz和Damien Robert之前的作品专注于在水平n coprime到l的ta模型中计算l-isogenies(这需要在尺寸g中使用n^g坐标)。 对于加密应用程序,我们需要计算2个异构的链,需要使用 ≥ 3^g 坐标在维度 g 中与最先进的算法。 在本文中,我们介绍了计算尺寸 g≥ 1 的 abelian 品种与 n=2 级坐标之间的 2 异构链的算法,在维度 g=2 中泛化了 Pierrick Dartois、Luciano Maino、Giacomo Pope 和 Damien Robert 之前的工作。 我们建议在尺寸 g=4 中实现这些算法,以计算源自Kani的Lemma的椭圆曲线产品的内啡肽,并应用于SQIsignHD和SIDH密码分析。 我们现在能够在SIDH上运行完整的密钥恢复攻击,当起始曲线的内啡肽环在几秒钟内未知时,所有NIST SIKE参数。

密码学与安全代数几何
arXiv

达到Tsfasman-Vladut-Zink界的LCD AG码序列与AG码的LCP

自Massey于1992年引入线性互补对偶(LCD)码以及Bhasin等人随后形式化线性互补对(LCPs)码(这些结构在密码学中具有重要应用)以来,这些码族引起了广泛关注。我们构造了从Garcia-Stichtenoth函数域塔中获得的无限序列(C_i)_i ≥ 1的LCD码和LCP对(C', D')_i ≥ 1,其中我们描述了塔的每一层上合适的低次非特殊除子。这些族达到了Tsfasman-Vlăduţ-Zink界,并且对于足够大的q,超过了经典的Gilbert-Varshamov界,提供了超越存在性结果的显式渐近良好构造。我们还展示了来自同一塔的自正交码(在𝔽_q^2上)以及当q为偶数时的自对偶码的无限序列,所有这些序列均达到了Tsfasman-Vlăduţ-Zink界。

代数几何信息论
arXiv

多项式亚代数的计算复杂性

自20世纪80年代以来,对多项式理想和Gröbner基础的计算复杂性进行了研究。 近年来,多项式亚代数和SAGBI碱基的相关概念在计算代数中获得了越来越多的关注,以期获得有效的算法。 我们研究子代数成员资格问题和学位边界的计算复杂性。 特别是,我们展示了复杂性类EXPSPACE的完整性,并证明了均匀代数的PSPACE完整性。 我们强调与理想设置的相似之处和差异,也看重要的多项式类,如单数代数。

计算复杂性交换代数代数几何
arXiv

数字计算Galois组的最小问题

我讨论了代数,数值计算和计算机视觉中看似不太可能的主题。 动机问题是解决代数(多项式或理性函数)方程系统的参数化家族的倍数实例。 毫无疑问,ISSAC与会者已经感兴趣了,这个问题出现在计算机视觉社区目前使用的强大的模型拟合范式(即“Random Sampling and Consensus”,又名“RanSaC”)。 这次演讲将概述过去5年多的工作,这些工作旨在衡量解决此类参数化系统的内在困难,并朝着实际解决方案迈进。

计算机视觉与模式识别符号计算代数几何
arXiv

由1-VASS认可的矩阵集的代数关闭

众所周知,如何计算有限生成的矩阵单体的Zariski闭包,更一般地说,计算由常规语言指定的一组矩阵。 这个结果最近被用来提供一个过程来计算给定亲和程序中的所有多项式不变。 使用递归过程调用计算所有多项式非同义程序调用的更普遍问题的可决定性仍然开放。 从数学上讲,核心挑战是计算由上下文无上下文语言定义的一组矩阵的Zariski闭合。 在本文中,我们从两个方面来处理这个问题:走向可判定性,我们给出了一个过程来计算由单计数器语言(即具有状态和零测试的一维矢量添加系统接受的语言)给出的矩阵集的Zariski闭包,这是一个适当的无上下文语言子类。 另一方面,我们表明,对于索引语言来说,问题变得不可决定,这是与嵌套式俯卧式自动机对应的无上下文语言的自然扩展。 我们的主要技术工具之一是西蒙的因子化森林对矩阵的无限单体进行了新的改编。

形式语言与自动机理论计算机科学中的逻辑代数几何
arXiv

灵活安排两个Bennett管

在类比柔性双嘧唑,也称为Bricard octahedra中,我们研究两种Bennett机制的柔性耦合。 由此产生的柔性双Bennett结构可以用作具有倾斜面的四边横截面的柔性管的构建块。 我们介绍了灵活的四维系列Bennett管,并分别讨论了它们的一些特性以及它们与柔性双吡咯吱和双棱镜的关系。

计算几何学代数几何
arXiv

5种不同数值ODE求解器在3个案例研究中的估计精度研究

数值常微分方程(ODE)求解器是各工程领域不可或缺的工具,可用于动态系统的仿真与分析。本研究采用5种不同的数值ODE求解器(欧拉法、休恩法、中点法、四阶龙格-库塔法和ODE45方法),通过计算相对误差来求解三个经典案例并比较其结果。为验证估计的有效性,我们将前人文献中的实验数据与本文数据进行对比,结果显示两者具有良好的一致性。研究发现,针对不同案例模型的行为特征,各求解器的估计精度存在差异。在第一个逻辑斯蒂人口变化案例中,所有求解器的结果十分接近,因此仅需考虑计算成本即可判定优劣。第二个建筑物温度变化案例表明,在某些特定区域求解器精度存在差异,总体而言中点ODE求解器表现更优。最后的市场均衡价格案例显示,由于其突变特性,所有数值ODE求解器均无法准确估计其行为。

数值分析代数几何微分几何
arXiv

球面上多项式优化的特征计算层次结构

我们提出了一种收敛的层次结构,用于计算单位球面上实形式最小值的下界。与实平方和(RSOS)层次结构相比,我们的主要实际优势在于:我们层次结构的每一级下界只需通过最小特征值计算获得,而不像RSOS每级都需要求解完整的半定规划(SDP)。这使得我们能够计算比RSOS方法更大规模形式的边界。无论是渐进性还是数值实验,我们的方法都优于RSOS的其他替代方案。我们通过证明从球面实优化到球面厄米特优化的约简,并调用厄米特平方和(HSOS)层次结构,从而获得这一层次结构。这为使用其他厄米特优化技术进行实优化打开了大门,并为开发更一般约束实优化问题的谱层次结构提供了路径。为此,我们使用这些技术开发了用于计算实张量谱范数的特征计算层次结构。

最优化与控制数据结构与算法代数几何量子物理学
arXiv

依赖均衡:边界情况及其实代数几何

本文在实代数几何框架下研究依赖均衡,涵盖纯均衡和混合均衡,是理解依赖均衡的重要进展。基于Spohn的原始定义,我们提出了两种替代定义,从而可以对所有依赖均衡进行代数几何综合研究。我们给出了纯依赖均衡存在的充分条件,并证明每个纳什均衡都位于Spohn簇上(依赖均衡的代数模型)。对于一般博弈,Spohn簇的实点集是Zariski稠密的。此外,在这种情况下,每个纳什均衡都是依赖均衡。最后,我们对(2×2)博弈的依赖均衡几何结构进行了详细分析。

代数几何计算机科学与博弈论
arXiv

欧莱茸的光谱松弛式 convex 套装

我们研究了由Brändén引入的欧莱茵多项式对多变量设置的概括。 虽然最初这些多项式是使用双曲和稳定多项式的语言引入的,但我们设法将这些多项式的一些限制转化为我们真正的零设置。 一旦我们处于这种设置中,我们将注意力集中在这些多项式定义的刚性凸集(RCS)。 特别是,我们研究相应的刚性凸套,研究通过使用小尺寸的单向对称线性矩阵多项式(MSLMP)构建的光谱松弛,并且取决于多项式(实际上只是立方体)对相应多项式系数。 我们分析了获得的光谱近似值对这些刚性凸集有多好。 我们通过测量对角线的行为进行这种分析,在那里我们精确地恢复原始的单变量欧乐体多项式。 因此,我们得出结论,通过对角线测量,我们基于松弛的光谱方法近似由多变量欧乐体多项式定义的刚性凸集是高度准确的。 特别是,我们看到这种基于放松的光谱方法近似由多变量Eullerian多项式定义的刚性凸集,为相应的单变量Eullerian多项式定义的极端根提供了界限,这些根系比文献中已经发现的这些极性更好。 总而言之,这告诉我们,至少接近对角线,这种基于放松的光谱方法提供的刚性凸集的全局外部近似本身是高度准确的。

组合数学数值分析代数几何最优化与控制
arXiv

用于线束及其在代数几何代码中的应用的分层不变性

我们介绍了平滑投影表面的线束的层次深度的概念,通过线子包的过滤来定义,并在有效的除接器上支持连续的报价。 这种不变性有助于通过离散的逐步构造来研究线束的代数和几何复杂性。 我们研究它的一些基本属性,包括限制曲线下的真菌行为以及与充足性和基点自由的兼容性。 将这个框架应用于代数几何(AG)代码,我们表明分层过滤会产生自然代码家族,其组合参数(维数,最小距离)在整个过滤中可预测地演变。

代数几何信息论交换代数
arXiv

变革卡拉比-丘构造:使用Transformers生成新型卡拉比-丘流形

四维自反多面体的精细/正则/星三角剖分(FRSTs)可产生环簇,其上的泛反典则超曲面形成光滑的卡拉比-丘三维流形。我们采用transformer——最初为语言建模开发的深度学习模型——来生成不同尺寸多面体的FRSTs。我们的模型展现出高效且无偏的采样能力,并能通过对其自身输出的再训练实现自我改进。这些成果为AICY平台奠定了基础:该社区驱动平台将自我改进的机器学习模型与持续扩展的FRST数据库相结合,用以探索和编目卡拉比-丘景观。

高能物理 - 理论机器学习代数几何
arXiv

椭圆

我们介绍了一个称为d度(GE-ds)的广义椭圆体家族,椭圆体对应于d=0的情况。 广义椭圆(GEs)保留了椭圆的许多几何,代数和算法特性。 我们表明,GE的参数必须满足的条件可以在强烈的多项式时间进行检查,并且可以通过解决一个半不确定的程序来搜索给定度的GE,其大小仅与维度线性增长。 我们举了一个没有二阶锥形表示的GE的例子,但表明每个GE都有半确定性表示,其大小线性取决于其尺寸和程度。 在表现力方面,我们证明对于任何整数m≥2,每个具有2m切面的对称全维聚体和m共中心椭圆的每个交叉点都可以完全表示为具有d≤2m-3的GE-d。 使用此结果,我们表明每个对称凸体都可以通过GE-d任意很好地近似,并且我们将近似值的质量量化为d度的函数。 最后,我们将GE应用于几个领域,例如时间变化组合优化,切换线性系统的稳定性分析,稳健到动态优化和稳健多项式回归。

最优化与控制数值分析系统与控制代数几何
arXiv

通过 Moment Matrix Extension 进行高效的 Tensor 分解

受最近一系列关于高效张量分解算法的工作的激励,我们展示了Brachat,Comon,Mourrain和Tsigaridas的著名时刻矩阵扩展算法,用于对称张量规范多音(CP)分解,可以在合适的条件下高效。 我们首先表明,决定算法复杂性的关键属性是目标分解的规律性。 这使我们能够降低香草算法的复杂性,同时也统一了以前作品的结果。 然后我们证明,对于具有 d 均匀的 S^dC^n+1 张量,足够低的规律性可以减少找到对称的张量分解,以解决线性方程系统。 对于顺序-4张量,我们证明等级高达r=2n+1的通用张量可以通过时刻矩阵扩展有效地分解,超过同时对角化允许的等级阈值。 然后,我们提出了一个猜想,即对排列 r=O(n^2) 的通用顺序-4张量表示诱导的线性系统足以进行有效的张量分解,匹配现有算法的渐近,实际上提高了领先系数。 在这个猜想中,我们提供计算机辅助证明,证明该语句为 n=2, ..., 17。 接下来,我们证明,可以通过瞬间矩阵扩展算法有效地分解不可识别的张量类,绕过分解的独一性。 特别感兴趣的是单体类,为此,扩展算法不仅有效,而且通过显式参数化分解空间来改进现有理论。 提供了通用张量和单倍体高效算法实现的代码,以及几个数字示例。

代数几何数值分析符号计算
arXiv

CompGIT包:几何不变理论的计算工具

我们描述了CompGIT,一个SageMath包,用于描述简单组的几何不变理论(GIT)预测空间的引数。 该实现基于Gallardo-Martinez-Garcia-Moon-Swinarski描述的算法。 原则上,该包足以描述一个简单的组对投影品种的任何GIT报价 - 实际上它要求用户可以构建将极化品种的等式嵌入到投影空间中。 该包描述了由组共轭的不稳定和不稳定的位点,以及描述严格的多稳态位点。 我们讨论了CompGIT输出对代数几何问题的潜在应用,以及为未来的发展指明方向。

代数几何计算几何学数学软件表示论
arXiv

深度多项式神经网络的可识别性

多项式神经网络(PNN)具有丰富的代数和几何结构。 然而,它们的可识别性——确保可解释性的关键属性——仍然知之甚少。 在这项工作中,我们全面分析了深度PNN的可识别性,包括具有和无偏见术语的体系结构。 我们的研究结果揭示了激活度和层宽度在实现可识别性方面的复杂相互作用。 作为特殊情况,我们表明,在温和的条件下,具有非增加层宽度的架构可以通用识别,而当解码器宽度不会增长过快时,编码器解码器网络是可识别的。 我们的证明是建设性的,集中在深度PNN和低等级张量分解和Kruskal型唯一性定理之间的联系上。 这既产生由架构决定的通用条件,也产生依赖于网络参数的有效条件。 我们还对PNN神经变异的预期维度进行了公开猜想,并为其达到最大值所需的激活度提供了新的界限。

机器学习人工智能代数几何机器学习 (统计)
arXiv

使用线性样品的代数品种的信号恢复

从其线性测量中恢复未知信号是跨越众多科学和工程学科的一个基本问题。 通常,先验知识表明,底层信号驻留在已知的代数范围内。 这种背景自然会导致一个问题:唯一恢复属于这种代数品种的任何信号所需的最小测量次数是什么? 在这篇调查论文中,我们介绍了一种利用代数几何学工具来解决这个问题的方法。 然后,我们通过将其应用于两个问题来证明这种方法的效用:相位检索和低等级矩阵恢复。

信息论代数几何
arXiv