高能物理 - 格点理论
High Energy Physics - Lattice
在临界点附近,格点量子场论(LQFT)的马尔可夫链蒙特卡洛(MCMC)模拟由于临界减速而变得越来越低效。在这项工作中,我们研究了基于分数的对称性保持扩散模型作为采样二维ϕ^4和U(1)格点场论的替代策略。我们开发了对一系列群变换具有等变性的分数网络,包括全局ℤ_2反射、局部U(1)旋转和周期平移𝕋。这些分数网络使用增强的训练方案进行训练,显著提高了模拟场论中的样本质量。我们还通过实验证明,我们的对称性感知模型在样本质量、表达能力和有效样本大小方面优于通用分数网络。
闵可夫斯基物理学的神经网络方法(M-PINN)是直接在闵可夫斯基时空解决量子电动力学(QED)的Dyson-Schwinger积分方程(DSE)的。 我们的新策略合并了两种互补的方法:(i)基于莱曼表示和减去分散关系的分散式求解器,以及(ii)学习费米子质量函数B(p^2)的M-PINN,在相同的截断和重整化配置(淬火,彩虹,Landau量表)下,将DSE残差与多尺度正则化和单调的损耗集成在一起。空间。 基准显示,在壳内和动量减法方案中,从红外(IR)到紫外线(UV)尺度的定量协议。 在这个受控设置中,我们的M-PINN再现了分散式解决方案,同时保持计算紧凑和可微分,为具有现实顶点,未熄灭效应和不确定性感知变体的扩展铺平了道路。
我们开发了一种基于非平衡模拟的方法,以便在接近晶格测量理论的连续极限时减轻拓扑冻结。 我们减少了使用开放边界条件的拓扑电荷的自相关关系,同时使用非平衡的蒙特卡洛方法完全消除了它们的非物理效应,其中周期性边界条件逐渐打开。 我们在四维SU(3) Yang-Mills理论的情况下对这种策略的计算成本进行了详细分析。 在完全控制缩放后,我们概述了一个明确的策略,在连续体极限中有效地采样拓扑结构,我们在小于0.045 fm的格位间距处检查。 我们还推广这种方法,为边界条件下的进化设计定制的随机规范化流,在纯随机的非平衡方法方面获得卓越的性能,并为更高效的未来基于流的解决方案铺平道路。
不规范化的概率分布是跨各种科学领域复杂物理系统建模的核心。 传统的采样方法,如马尔可夫链蒙特卡洛(MCMC),经常受到缓慢收敛,临界减速,不良模式混合和高自相关性的影响。 相比之下,基于可能性和对抗性的机器学习模型虽然有效,但在很大程度上是数据驱动的,需要大型数据集,并且经常遇到覆盖模式和模式崩溃。 在这项工作中,我们提出了ScoreNF,一个基于标准化流程(NF)架构的基于分数的学习框架,与独立大都会 - 哈斯丁(IMH)模块集成,可实现从非标准化目标分布中进行高效和无偏见的采样。 我们表明,即使使用小型训练集成,ScoreNF也能保持高性能,从而减少对计算昂贵的MCMCM生成训练数据的依赖。 我们还介绍了一种评估模式覆盖和模式崩溃行为的方法。 我们验证了合成2D分布(MOG-4和MOG-8)和高维 φ^4 晶格场理论分布的方法,证明了其对采样任务的有效性。
使用机器学习算法来研究物理系统中的相变是更好地了解这些系统特征的宝贵方法。 神经网络已被用来直接从多体配置中提取相位和相变的信息。 然而,神经网络的一个限制是,它们需要定义其应用之前的模型架构和参数,而这样的确定本身就是一个难题。 在本文中,我们首次研究了神经网络对相位信息的准确性与网络配置(包括体系结构和超参数)之间的关系。 我们制定相位分析作为回归任务,解决生成反映物理系统不同状态的数据的问题,并评估神经架构搜索此任务的性能。 在获得优化的架构后,我们通过神经元覆盖指标进一步实现智能数据处理和分析,评估这些指标估计阶段过渡的能力。 我们的研究结果将神经元覆盖率指标确定为检测物理系统中的相变很有希望。
我们研究具有任意节点数的网格中给出的函数的数值分化公式。 我们调查计算第一个和第二个衍生物的公式中的无限点数的情况。 获得相应的重量系数序列的光谱。 我们检查奇数点给出的函数的第一个导数计算,并分析有限和无限多节点情况下权重系数序列的光谱。 我们得出第一个导数的片面近似值,并检查其光谱特性。
本文介绍了一种新的蒙特卡洛算法来倒置大型矩阵。 它基于来自两个随机向量的同时耦合,其协方差是所需的反向。 它可以被认为是以前报告的基于一个平局的隐士矩阵反转算法的概括。 使用两个平局允许反转在非赫密斯矩阵。 收敛的条件和收敛率都类似于高斯-塞德尔算法。 介绍了两个例子的结果,一个真正的非对称矩阵与定量遗传学有关,一个复杂的非隐密矩阵与物理学家有关。 与其他蒙特卡罗算法相比,它揭示了在研究的例子中显示处理速度加快8倍的大大减少。
我们分析了 Neuberger 的矩阵-向量乘法 R(H).Y(其中 R(H) 是 (n-1,n)-th 度的正定运算符 H 的度 rational 多项式算法),并表明浮点运算数独立于度 n,前提是站点的数量远大于共轭梯度中的迭代次数。 这意味着矩阵矢量产品(H)^-1/2 Y ≃ R^(n-1,n)(H) · Y可以近似于非常高的精度,具有足够大的n,而不会产生明显的额外费用。 此外,我们表明存在一个阈值n_T,使得双关比n > n_T的单次传球更快,大多数平台的n_T≃12 - 25。
我们得出了中心分化的公式,用于查找离散点中给出的函数的第一个和第二个导数,点数是任意的。 衍生计算所得公式不需要直接构造插值多项式。 作为使用开发方法的一个例子,我们计算了具有已知导数分析值的函数的第一个导数。 结果在无限多点的限制情况下进行了检查。 我们研究了数值分化公式的重量系数序列的光谱特征。 进行的调查使一个人能够分析使用开发的技术进行的数字分化的准确性。
晶格场理论是计算物理学的基本试验床;然而,由于多模态性和长距离相关性,采样玻兹曼分布仍然具有挑战性。 虽然标准化流程提供了一种有希望的替代方案,但它们应用于大型晶格通常受到令人望而却步的内存要求和保持足够模型表达性的挑战的限制。 我们建议使用单调的整流神经网络(MRNN)在周期性边界条件下显式利用晶格图的条件独立性结构来显式利用稀疏三角形传输图。 我们为三角形传输地图引入了一个全面的框架,该框架可以导航精确稀疏(在目标分布中尊重边际条件独立性)和近似稀疏(没有填充的计算可处理性)之间的基本权衡。 将每个三角形地图组件限制在局部过去,使晶格尺寸N的站点式并行评估和线性时间复杂度成为可能,同时保持可表达的,可逆的结构。 使用 φ^4 在二维中作为受控设置,我们分析节点标签(排序)如何影响三角形地图的稀疏性和性能。 我们比较混合蒙特卡洛(HMC)和既定的流量方法(RealNVP)。
我们提出了一个数学框架,用于在格子场理论中路径积分的 Galerkin 公式。 该框架基于使用与Galerkin离散化相关的自由度作为基本的格子变量。 我们在格子场理论中制定标准概念,如分区函数和相关性函数,在自由度方面。 例如,使用连续的有限元空间,我们表明两点空间相关性函数可以在域上的任何两点(而不是仅仅晶格位位点)之间定义,并且此外,这满足了弱传播者(或格林的函数)身份,与连续体案例类比。 此外,这个框架通过考虑高阶的有限元空间来自然地导致高层次的格子场理论的公式。 我们考虑标量场理论的分析和数值示例,以研究增加分段多项式有限元空间的顺序如何影响晶格可观测值的近似值。 最后,我们在量表场理论的背景下勾勒出这个Gaalkin框架的轮廓。
自动回归神经网络(ANN)最近被提出作为提高蒙特卡罗算法效率的机制,用于几个自旋系统。 这个想法依赖于这样一个事实,即配置的总概率可以分解为每个自旋的条件概率,而神经网络又可以通过神经网络近似。 一旦训练,ANN 可用于从近似概率分布中采样配置,并显式评估给定配置的概率。 也有人观察到,这种有条件的概率使信息理论可观测物,如相互信息或纠缠熵。 到目前为止,这些方法已被应用于二维统计系统或一维量子系统。 在本文中,我们将分层算法的概括描述为三个空间维度,并在Ising模型的例子上研究其性能。 我们讨论了训练的效率,并通过比较具有相同数量旋转的二维和三维 Ising 模型的结果来描述缩放与系统的尺寸。 最后,我们为三维 Ising 模型提供热力学可观测值的估计值,例如在整个相变中温度范围内熵和自由能量。
由于复杂动作或玻尔兹曼重量而导致标志问题理论有时可以在复杂的配置空间中使用随机过程进行数值解决。 然而,通过这种复杂的Langevin过程有效采样的概率分布并不为人所知,并且臭名昭着地难以理解。 在生成式AI中,扩散模型可以从数据中学习分布或其日志衍生物。 我们探索扩散模型学习复杂朗格文过程采样分布的能力,比较基于分数和基于能量的扩散模型,并推测可能的应用。
我们介绍了基于 的软件包,旨在促进格子场理论中神经采样器的研究。 基于正常化流动的神经采样器在蒙特卡洛模拟的背景下越来越受欢迎,因为它们可以有效地近似目标概率分布,可能减轻马尔可夫链蒙特卡洛方法的一些缺点。 我们的软件包提供了为二维场理论创建此类采样器的工具。
线性系统产生于生成样品和计算晶格量子色动力学(QCD)中的可观测物。 解决Hermitian正确定性系统,这是稀疏但条件差,涉及使用迭代方法,如共轭梯度(CG),这是耗时和计算昂贵的。 预处理程序可以有效地加速这一过程,最先进的是多网格预处理器。 然而,构建有用的预处理程序可能具有挑战性,增加了额外的计算开销,特别是在大型线性系统中。 我们提出了一个框架,利用操作员学习技术,将线性地图作为有效的先决条件。 这项工作中的方法不依赖于原始线性系统或产生的预处理器的显式矩阵,允许在CG求解器中进行高效的模型训练和应用。 在Schwinger模型U(1)测量理论在1+1时空尺寸与两个退化质量费米子的背景下,这种预后方案有效地减少了线性系统的条件数量,并将相关参数范围内收敛所需的迭代次数大约减半。 我们进一步演示该框架学习依赖于晶格结构的一般映射,从而为由不同尺寸的测量场配置构建的Dirac运算符提供零射学习能力。
调查关键现象或相变对物理和化学有很高的兴趣,蒙特卡洛(MC)模拟是数值分析给定系统宏观特性的关键工具,通常受到相关性长度的新兴差异的阻碍 - 称为重整化组理论中临界度(SIC)的尺度不变性。 SIC导致系统在任何长度尺度上的行为相同,许多现有的采样方法都会受到影响:远程相关性导致马尔可夫链蒙特卡洛(MCMC)的临界减速,并且需要用于生成采样器的难以蚀性大接受字段。 在本文中,我们提出了一个重规范化知情的生成关键采样器(RiGCS) - 一种专门用于近临界系统的新型采样器,其中SIC被利用作为一种优势而不是滋扰。 具体来说,RiGCS基于MultiLevel Monte Carlo(MLMC)与Heat Bath(HB)算法构建,该算法通过站点上独立的条件HB采样执行从低分辨率到高分辨率晶格配置的祖先采样。 虽然MLMC-HB在精确的SIC下效率很高,但在轻微的SIC违规下,它的接受率很低。 值得注意的是,SIC违规总是发生在有限大小的系统中,并且可能会诱发重态分布中的长程和高阶相互作用,这些相互作用不受独立的HB采样器的考虑。 RiGCS通过将条件HB采样器的一部分替换为生成模型来增强MLMC-HB,这些模型可以捕获这些剩余相互作用并提高采样效率。 我们的实验表明,在128x128二维Ising系统的采样配置中,RiGCS的有效样本量比最先进的生成模型基线高出几个数量级。
超参数调优是保证机器学习模型融合的基本步骤之一。 我们认为,关于随机梯度下降超参数最佳选择的直觉可以通过研究神经网络的相位图获得,其中每个相位的特点是重量矩阵的奇异值的独特动力学。 从无序系统中获得灵感,我们从观察开始,即具有平均平方误差的多层神经网络的损失景观可以解释为特征空间中的无序系统,其中学习的特征被映射到软旋转的自由度,重量矩阵的初始方差被解释为无序的强度,温度由学习率和批次大小的比例给出。 随着模型的训练,可以确定三个阶段,其中重量矩阵的动力学在质量上是不同的。 使用以前使用Dyson Brownian运动得出的随机梯度下降的Langevin方程,我们证明可以有效地分类三种动力学机制,为优化器的超参数选择提供实用指导。
有效的弦理论(EST)提供了一个强大的非扰动框架,用于描述杨-米尔斯理论中的禁闭性,将静态夸克-抗夸克对之间的限制作为薄的振动弦。 虽然EST计算通常使用zeta-function正则化进行,但某些问题 - 例如确定通量管宽度 - 太复杂,无法分析解决。 然而,最近的研究表明,可以通过采用基于生成算法的深度学习技术来对EST进行数值探索。 在这项工作中,我们简要介绍了EST和这种新颖的数字方法。 最后,我们介绍了Nambu-Gotö EST宽度的结果。
最近的工作引入了一个新的框架,用于分析具有改善的收敛和信噪的相关性函数,以及严格的兴奋状态效应量化,基于Lanczos算法和Cullum-Willoughby测试的虚假特征值过滤。 在这里,我们将这个框架扩展到分析由晶格量子色动力学(QCD)中的多个插值运算符构建的相关性函数矩阵,通过构建块Lanczos算法的斜泛化,以及Cullum-Willoughby测试的新物理动机重新配制,该测试泛化以直接阻止Lanczos。 生成的块Lanczos方法直接扩展了广义特征值问题(GEVP)方法,可以将其视为应用块Lanczos的单个迭代。 与GEVP方法相比,Block Lanczos提供了定性和定量优势,类似于Lanczos相对于标准有效质量的好处,包括更快的与接地和激发态能量的收敛,显式可计算的双面误差边界,直接提取外部电流的矩阵元素,以及渐近恒定的信噪比。 不需要拟合或统计推断。 原理验证计算用于无噪声模拟数据示例以及晶格QCD中的二乘二质子相关性函数矩阵。
多网格求解器是现代科学计算模拟的标准。 领域分解基于聚合的代数多网格,也称为DD-αAMG求解器,是晶格量子色动力学的代数多网格求解器的成功实现。 它的CPU实现使得在某些特定的离散化中构建模拟成为可能,否则计算不可行,并且它还推动了该地区其他代数多网格求解器的开发和改进。 从已经部分通过CUDA移植的DD-αAMG的现有版本到在Nvidia GPU上运行多网格求解器的一些最高级别的操作,我们通过使用HIP在ORISE超级计算机上运行来翻译CUDA代码。 此外,我们还扩展了DD-αAMG中可用的平滑器,特别注意Richardson平滑,在我们的数值实验中,多网格求解器比使用GCR平滑更快,只有10个
继续滚动加载更多