给定形式 ax + by = cz 的线性方程 E,其中 a, b, c 是正整数, k 色 R_k(E) 是最小的正整数 n,如果它存在,使得正整数 {1, 2, ..., n} 的每个 k 着色都包含 E 的单色解。 在本文中,我们考虑 k = 3 和线性方程 ax + by = bz 和 ax + ay = bz。 使用SAT求解器,我们计算了一些与这些方程对应的以前未知的Rado数字。 我们证明了对 Rado 数字的新的一般界限,灵感来自 SAT 求解器发现的令人满意的作业。 我们的证明需要广泛的基于案例的分析,这些分析很难用手检查正确性,所以我们通过使用我们开发的新方法自动检查证明的正确性,该方法支持符号定义集的操作 - 例如,表单{f(1),f(2),...,f(a)}的集合的工会或交叉点,其中a是一个符号变量,f是可能依赖于a的函数。 我们所知的计算机代数系统目前对符号集有足够能力的支持,导致我们开发了一个支持符号集的工具,使用Python符号计算库SymPy加上可满足性模块理论解决器Z3。
深度符号优化(DSO)是一种新的计算框架,可以为科学发现实现符号优化,特别是在涉及寻找复杂符号结构的应用中。 一个值得注意的例子是方程发现,它旨在自动推导出以符号形式表示的数学模型。 在DSO中,发现过程被制定为顺序决策任务。 生成式神经网络在候选人符号表达式的广阔空间中学习概率模型,而强化学习策略则引导搜索最有前途的区域。 该方法将基于梯度的优化与进化和本地搜索技术集成在一起,并集成了原位约束、特定领域先验和高级策略优化方法。 其结果是一个强大的框架,能够有效地探索广泛的搜索空间,以识别可解释和物理上有意义的模型。 对基准问题的广泛评估表明,DSO在准确性和可解释性方面均达到最先进的性能。 在本章中,我们全面概述了DSO框架,并说明了其在科学发现中自动化符号优化的变革潜力。
知识图谱(KGs)已成为管理现实世界事实的有效范式,这些事实不仅复杂,而且随着时间的推移而动态演变。 事实的时间有效性通常作为下游链接预测任务的有力线索,该任务预测了事实中缺失的元素。 传统的时间KG链接预测技术要么考虑具有临时定义的时间间隔的KGs的时间快照序列,要么在预定义的时间粒度下在其有效期内扩展时间事实;这些方法不仅受到时间间隔/粒度选择的敏感性的影响,而且在处理具有长(甚至无限)有效性的事实时也面临计算挑战。 虽然最近的超关系KGs代表了一个事实的时间有效性作为描述事实的限定词,但它仍然是次优的,因为它对某些事实的无限有效性的无知以及从限定词中编码的关于时间有效性的信息不足。 在这种背景下,我们提出了VITA,一种用于时间超关系知识图谱的通用tIme重复学习方法。 我们首先提出了一个多功能的时间表示,可以灵活地容纳事实的所有四种时间有效性(即,因为,直到,期间,时间不变),然后设计VITA,以有效地学习时间值和时间跨度两个方面的时间信息,以提高链接预测性能。 我们对VITA进行了彻底的评估,与现实世界KG数据集的大量基线集合相比。 结果表明,VITA在各种链接预测任务(预测缺失实体,关系,时间和其他数字字面量)中的表现优于最佳基线,最多选择75.3个。
知识图谱(KGs)已成为管理现实世界事实的有效范式,这些事实不仅复杂,而且随着时间的推移而动态演变。 事实的时间有效性通常作为下游链接预测任务的有力线索,该任务预测了事实中缺失的元素。 传统的时间KG链接预测技术要么考虑具有临时定义的时间间隔的KGs的时间快照序列,要么在预定义的时间粒度下在其有效期内扩展时间事实;这些方法不仅受到时间间隔/粒度选择的敏感性的影响,而且在处理具有长(甚至无限)有效性的事实时也面临计算挑战。 虽然最近的超关系KGs代表了一个事实的时间有效性作为描述事实的限定词,但它仍然是次优的,因为它对某些事实的无限有效性的无知以及从限定词中编码的关于时间有效性的信息不足。 在这种背景下,我们提出了VITA,一种用于时间超关系知识图谱的通用tIme重复学习方法。 我们首先提出了一个多功能的时间表示,可以灵活地容纳事实的所有四种时间有效性(即,因为,直到,期间,时间不变),然后设计VITA,以有效地学习时间值和时间跨度两个方面的时间信息,以提高链接预测性能。 我们对VITA进行了彻底的评估,与现实世界KG数据集的大量基线集合相比。 结果表明,VITA在各种链接预测任务(预测缺失实体,关系,时间和其他数字字面量)中的表现优于最佳基线,最多选择75.3个。
给定形式 ax + by = cz 的线性方程 E,其中 a, b, c 是正整数, k 色 R_k(E) 是最小的正整数 n,如果它存在,使得正整数 {1, 2, ..., n} 的每个 k 着色都包含 E 的单色解。 在本文中,我们考虑 k = 3 和线性方程 ax + by = bz 和 ax + ay = bz。 使用SAT求解器,我们计算了一些与这些方程对应的以前未知的Rado数字。 我们证明了对 Rado 数字的新的一般界限,灵感来自 SAT 求解器发现的令人满意的作业。 我们的证明需要广泛的基于案例的分析,这些分析很难用手检查正确性,所以我们通过使用我们开发的新方法自动检查证明的正确性,该方法支持符号定义集的操作 - 例如,表单{f(1),f(2),...,f(a)}的集合的工会或交叉点,其中a是一个符号变量,f是可能依赖于a的函数。 我们所知的计算机代数系统目前对符号集有足够能力的支持,导致我们开发了一个支持符号集的工具,使用Python符号计算库SymPy加上可满足性模块理论解决器Z3。
深度符号优化(DSO)是一种新的计算框架,可以为科学发现实现符号优化,特别是在涉及寻找复杂符号结构的应用中。 一个值得注意的例子是方程发现,它旨在自动推导出以符号形式表示的数学模型。 在DSO中,发现过程被制定为顺序决策任务。 生成式神经网络在候选人符号表达式的广阔空间中学习概率模型,而强化学习策略则引导搜索最有前途的区域。 该方法将基于梯度的优化与进化和本地搜索技术集成在一起,并集成了原位约束、特定领域先验和高级策略优化方法。 其结果是一个强大的框架,能够有效地探索广泛的搜索空间,以识别可解释和物理上有意义的模型。 对基准问题的广泛评估表明,DSO在准确性和可解释性方面均达到最先进的性能。 在本章中,我们全面概述了DSO框架,并说明了其在科学发现中自动化符号优化的变革潜力。
L_∞-规范的计算是H_∞控制的一个重要问题,特别是用于分析系统稳定性和鲁棒性。 本文侧重于用于确定有限维线性系统的 L_∞- 规范的符号计算方法,强调了他们在数值方法经常遇到限制的情况下实现精确解决方案的优势。 关键技术,如Sturm-Habicht序列,Rational Univariate Representations(RUR)和Cylindrical Algebraic Decomposition(CAD)进行了调查,重点是其理论基础,实际实现以及L_∞-规范计算的特定适用性。 在符号和常规数值方法之间进行比较分析,强调了符号计算提供卓越准确性的情景,特别是在参数化情况下。 基准评价揭示了这两种方法的优势和局限性,提供了对所涉权衡的见解。 最后,讨论讨论了符号计算的挑战,并探讨了将其整合到控制理论中的未来机会,特别是对于稳健和稳定的系统分析。
大型语言模型(LLM)是非常高性能的连接系统,但它们是否表现出更多的组成性? 更重要的是,这是他们表现如此好的一部分吗? 我们介绍了四个LLM家族(12个模型)和三个任务类别的实证分析,包括下面介绍的一项新任务。 我们的发现揭示了LLM学习组合策略的微妙关系 - 虽然缩放增强了组合能力,但指令调整通常具有相反的效果。 这种差异带来了一些悬而未决的问题,即大型语言模型的发展和改进与人类认知能力一致。
我们提出了一种新的算法RXTX,它通过其转置XX^t计算矩阵的产物。 RXTX使用比最先进的乘法和加法少5%,即使对于小尺寸的矩阵X也能实现加速度。 该算法是通过将基于机器学习的搜索方法与组合优化相结合而发现的。
我们提出了一个高效的算法,用于计算单一基因组序列的最小Groebner基础的领先单体。 我们的方法绕过了昂贵的多项式还原,利用结构特性来具体确定通用序列,即他们领先的单项理想是弱反向词法,并且他们的Hilbert系列遵循已知的封闭形式表达。 该算法通过将单体理想的Hilbert函数与预期的Hilbert系列输入理想进行比较,逐步构建了一组领先的单模度。 为了提高计算效率,我们引入了几种优化技术,可以逐步缩小搜索空间,并减少每个步骤所需的可分裂性检查数量。 我们还使用度边界改进循环终止条件,从而避免对 Hilbert 系列进行不必要的重新计算。 实验结果证实,与传统的Groebner基础计算相比,所提出的方法大大减少了计算时间和内存使用,特别是对于大型系统。 这些结果表明,我们的算法可以作为有效的预处理工具,用于在通用多项式序列求解中加速Groebner基础计算。
本文解决了在n个布尔变量中判定布尔映射F的可逆性(或一对一性)的计算问题。这个问题是判定有限域𝔽_q上映射F:𝔽_q^n→𝔽_q^n的可逆性的一种特殊情况,其中q=2。F的可逆性代数条件众所周知等价于F的Koopman算子的可逆性,如<cit.>所示。在本文中,我们推导了布尔映射F:B_0^n→ B_0^n的可逆性条件,其中B_0是两个元素的布尔代数,该条件基于由映射定义的布尔方程的蕴含式。然后,我们将此条件扩展到n个变量和m≥n个方程的一般映射。因此,该条件以蕴含式而非Koopman算子的形式回答了定义在二元域𝔽_2上的映射F的可逆性特殊情况。判定映射F的可逆性问题(或寻找其伊甸园(GOE))与有限域上的可满足性问题(SAT)或判定多项式方程组一致性问题不同。因此,用于判定SAT或使用格罗布纳基检查理想中多项式成员资格的众所周知的算法并不能回答映射的可逆性问题。同样,即使对于定义在二元域𝔽_2上的映射,可满足性或多项式可解性算法似乎对计算F的GOE也没有用处。
本文演示了如何使用经过认证的计算工具来解决控制理论中的各种问题。 特别是,我们引入了PACE.jl,一个Julia包,实现了符号消除技术,包括(除其他外)判别品种和Rational Univariate Representation,同时还支持多精度间隔计算。 我们展示了其对关键控制理论问题的应用,包括识别、稳定性分析和优化,适用于参数依赖性和无参数系统。
我们提出了一种新的符号回归方法,使用具有视觉能力的大型语言模型(LLM)和Google DeepMind的Funsearch背后的思想。 LLM被赋予一个单变量函数的图,并负责为该函数提出一个 ansatz。 ansatz的自由参数使用标准数值优化器安装,并且这些 anätze 的集合构成了遗传算法的数量。 与其他符号回归技术不同,我们的方法不需要在回归中使用一组函数的规范,而是通过适当的提示工程,我们可以任意调节生成步骤。 通过使用 Kolmogorov Arnold Networks (KANs),我们证明了符号回归的“univariate is all you need”,并通过学习训练过的 KAN 的每个边缘上的 Univariate 函数将这种方法扩展到多变量函数。 然后通过进一步处理语言模型来简化组合表达式。
我们提出了第一个线性时间算法来计算(nonconvex)双变量分段线性二次(PLQ)函数的共轭(在多面体分区上定义的双变量二次函数)。 我们的算法从计算每个二次元的凸信封开始,获得在多面分法上定义的合理函数(二次超过线性)。 然后我们计算每个生成的片段的共轭,以获得在抛物线细分上定义的分段二次函数。 最后,我们计算所有这些函数的最大值,以获得共轭作为在抛物线分区上定义的分段二次函数。 生成的算法在线性时间运行,如果初始分区是三角测量(或每件的vertexes数量上有一个均匀的上限)。 我们在MATLAB中的开源实现使用符号计算和合理数字来避免浮点错误,并尽快合并碎片,以尽量减少计算时间。
教学设计师面临着大量的设计选择,因此很难确定最有效的干预措施。 为了解决这个问题,我提出了人类学习者模型的概念,这是一个统一的学习计算模型,可以帮助设计师评估候选干预措施。 本文首次成功演示了这一概念,表明计算模型可以准确预测两个人类A / B实验的结果 - 一个测试问题测序干预,另一个测试项目设计干预。 它还表明,这样的模型可以在不需要人类数据的情况下生成学习曲线,并提供理论见解,说明为什么教学干预是有效的。 这些发现为未来的人类学习者模型奠定了基础,这些模型将认知和学习理论整合在一起,以支持跨不同任务和干预的教学设计。
对称函数之间的不平等是数学各个分支的基础,从而激励对其结构进行系统的研究。 重制已被证明是常用对称函数之间的不平等的特征,除了完整的同质对称函数(缩短为CHs)。 2011年,Cuttler、Greene和Skandera提出了一个自然问题:专业化能否也表征CHs之间的不平等? 他们的工作表明,占多数的特征是CHs之间的不平等,最高可达7度,并建议探索其有效性。 在本文中,我们表明,对于每一个大于7的学位,占多数并没有表征CHs之间的不平等。
对称多项式函数之间的不平等是数学中的基本问题,在科学和工程中具有各种应用。 本文调查了由Cuttler,Greene和Skandera于2011年提出的一个美丽而鼓舞人心的猜想,关于完全同质对称多项式函数H_n,λ:μ之间的不等式H_n,λ≤H_n,μ意味着大验制顺序λ≼μ。 这个猜想与 Muirhead 型不平等的其他已知结果是一个密切的类比。 2021年,Heaton和Shankar通过显示变量n=3和度d=8的计数例来反驳猜想。 然后,他们询问当n足够大时猜想是否真实。 在本文中,我们通过反例家庭表明,猜想不成立任何n和任何d,只要n≥2和d≥8。 基于从反例中获得的见解,我们提出了不平等H_n,λ≤H_n,μ的新猜想。
我们提供了一种算法,用于计算P^1上椭圆表面纤维产品同源性的基础,以及相应的交叉产品和时期矩阵。 我们使用这些数据来调查以这种方式获得的Calabi-Yau三倍的伽马猜想。 我们找到一个公式,适用于105种纤维产品列表的所有运营商,以及Calabi-Yau数据库的四阶运营商。 该算法带有 SageMath 实现。
我们提供通过执行 D 代数函数的闭包属性获得的多项式微分方程的大小的界限。 虽然很容易在这些方程的顺序上获得界限,但它需要更多的工作来得出它们的程度的界限。 在这里,我们给出了在定义微分方程的一些技术条件下适用的界限。
符号回归(SR)是一种强大的技术,用于自动从输入数据中发现数学表达式。 主流SR算法在广阔的功能空间中搜索最佳符号树,但树结构的日益复杂限制了它们的性能。 受神经网络的启发,符号网络已成为一种有前途的新范式。 然而,大多数现有的符号网络仍然面临某些挑战:二进制非线性运算符 {×, ÷} 不能自然地扩展到多变量运算符,而具有固定架构的训练往往会导致更高的复杂性和过度拟合。 在这项工作中,我们提出了一个统一符号网络,将非线性二进制运算符统一为嵌套的单数运算符,并定义UniSymNet可以降低复杂性的条件。 此外,我们预先训练了具有新颖标签编码方法的Transformer模型来指导结构选择,并采用针对目标的优化策略来学习符号网络的参数。 UniSymNet 表现出高拟合精度、出色的符号化解决方案速率和相对较低的表达复杂性,在低维标准基准和高维SRBench上实现了具有竞争力的性能。
Moosbauer和Poole最近表明,两个5×5矩阵的乘法在(可能非交换)系数环中要求不超过93个乘法,并且两个6×6矩阵的乘法要求不超过153个乘法。 以这些乘法方案为起点,我们发现使用翻转图搜索为各种矩形矩阵格式改进了矩阵乘法方案。
如今,由Fröberg最初提出的半正则序列的概念不仅在数学中,而且在信息科学中,特别是在密码学中变得非常重要。 例如,人们非常期望随机生成的多项式形成半规则序列,并且基于此观察,可以设计基于多项式系统的安全密码系统。 在本文中,我们处理一个半正则序列及其扩展,命名为广义加密半正则序列,并精确分析计算Gröbner基础的复杂性,该序列产生的理想基础与Lazard在最大Gröbner基础度和其他边界上绑定的几个正则相关。 我们还研究了序列是半规则的属性的通用性,以及它与Fröberg猜想相关的变体。 此外,我们讨论了另一个重要属性的通用性,即最初的理想是弱反向词法,与莫雷诺-索西亚斯的猜想有关,并展示了一些标准来检查Fröberg的猜想和莫雷诺-Socías是否同时持有。
给定一个具有绝对伽罗瓦群 𝒢 的数域,一个有限伽罗瓦模 M,以及一个 Selmer 系统 ℒ,本文给出了一种计算 Sel_ℒ 的方法,即附着于 ℒ 的 M 的 Selmer 群。首先,我们描述了一种获得 M 的分解的方法,其中态射由 Hecke 算子给出。然后,我们构造了另一个群 H^1_S(𝒢, M),并利用 Hecke 算子的性质证明 H^1_S(𝒢, M) 是一个包含 Sel_ℒ 的 Selmer 群。然后,我们讨论了该方法的时间复杂度。