高能物理 - 唯象学
High Energy Physics - Phenomenology
我们介绍了“2022年快速卡路里模拟挑战赛”的结果 - CaloChallenge。 我们研究四种高分子淋浴数据集上最先进的生成模型,这些数据集的维度越来越大,从几百个体素到几千个体素不等。 31个单独的提交涵盖了广泛的当前流行的生成式架构,包括变式自动编码器(VAE),生成对抗网络(GAN),标准化流,扩散模型和基于条件流匹配的模型。 我们比较所有提交的生成热量计淋浴的质量,以及淋浴生成时间和模型大小。 为了评估质量,我们使用广泛的不同指标,包括可观测的三维直方图,KPD / FPD分数,二进制分类器的AUC和多类分类器的日志后验的差异。 CaloChallenge的结果提供了迄今为止最完整和全面的热度计快速仿真方法的调查。 此外,我们的工作为如何评估生成模型这一重要问题提供了独特的详细视角。 因此,这里介绍的结果应该适用于使用生成式AI的其他领域,并且需要在大相位空间中快速忠实地生成样本。
我们使用机器学习技术重新审视了SU(5)大统一理论的费米子质量问题。 Georgi和Glashow提出的原始SU(5)模型与观察到的费米子质量谱不相容。 有两种补救措施可以解决这种差异,一种是通过45维场引入新的相互作用,另一个通过24维场引入新的相互作用。 我们研究哪种修改更自然,将自然性定义为接近原始Georgi-Glashow SU(5)模型。 我们的分析显示,在超对称和非超对称场景中,结合与24维场相互作用的模型在这个标准下更加自然。 然后,我们通过引入一个连续参数 y 来概括这些模型,该参数为 45 维字段,以值 3 为 45 维字段,1.5 为 24 维字段。 数值优化显示,y ≈ 0.8 产生与原始 SU(5) 模型最接近的匹配,表明根据我们的定义,该值对应于最自然的模型。
生成模型对科学工作流程越来越重要,但其系统使用和解释需要通过严格的验证来正确理解其局限性。 当应用于高维数据时,经典方法与可扩展性,统计能力或可解释性作斗争,因此很难在现实,高维的科学环境中证明这些模型的可靠性。 在这里,我们建议使用新物理学习机(NPLM),这是一种基于学习的基于学习的适合测试的方法,灵感来自Neyman-Pearson结构,以测试基于高维科学数据训练的生成网络。 我们在两个基准案例中展示了用于验证的NPLM的性能:在具有越来越大尺寸的高斯模型的混合物上训练的生成模型,以及大型强子对撞机的公共端到端发生器称为FlashSim,在射流数据上训练,典型的是高能物理领域。 我们证明 NPLM 可以作为一种强大的验证方法,同时也提供了一种诊断数据次优建模区域的手段。
我们将批量边界分解作为理解深度神经网络训练动力学的新框架。 从随机梯度下降公式开始,我们表明拉格朗日可以重组为数据无关的散装项和数据依赖边界项。 批量捕获网络架构和激活函数设置的内在动力学,而边界反映了输入和输出层训练样本的随机相互作用。 这种分解暴露了深层网络背后的局部和均匀结构。 作为自然扩展,我们基于这种分解开发神经动力学的场上理论公式。
物理对称性为构建函数分析数据提供了很强的电感偏差。 特别是,这种偏见可以提高机器学习模型的鲁棒性、数据效率和可解释性。 然而,由于所需的专用组件,构建明确尊重对称性的机器学习模型可能很困难。 此外,现实世界的实验可能并不完全尊重有限粒度和能量阈值水平的基本对称性。 在这项工作中,我们探索了创建对称感知机器学习模型的替代方法。 我们引入了软约束,允许模型在学习过程中决定添加对称性的重要性,而不是执行精确的对称性。 我们研究两种互补的方法,一种是根据输入的具体变换来惩罚模型,一种是受群论和输入的无穷小变换的启发。 使用顶级夸克喷射标记和Lorenz equivariance作为示例,我们观察到软约束的添加会导致更稳健的性能,同时需要对当前最先进的模型进行可忽略不计的更改。
闵可夫斯基物理学的神经网络方法(M-PINN)是直接在闵可夫斯基时空解决量子电动力学(QED)的Dyson-Schwinger积分方程(DSE)的。 我们的新策略合并了两种互补的方法:(i)基于莱曼表示和减去分散关系的分散式求解器,以及(ii)学习费米子质量函数B(p^2)的M-PINN,在相同的截断和重整化配置(淬火,彩虹,Landau量表)下,将DSE残差与多尺度正则化和单调的损耗集成在一起。空间。 基准显示,在壳内和动量减法方案中,从红外(IR)到紫外线(UV)尺度的定量协议。 在这个受控设置中,我们的M-PINN再现了分散式解决方案,同时保持计算紧凑和可微分,为具有现实顶点,未熄灭效应和不确定性感知变体的扩展铺平了道路。
我们开发了一种基于非平衡模拟的方法,以便在接近晶格测量理论的连续极限时减轻拓扑冻结。 我们减少了使用开放边界条件的拓扑电荷的自相关关系,同时使用非平衡的蒙特卡洛方法完全消除了它们的非物理效应,其中周期性边界条件逐渐打开。 我们在四维SU(3) Yang-Mills理论的情况下对这种策略的计算成本进行了详细分析。 在完全控制缩放后,我们概述了一个明确的策略,在连续体极限中有效地采样拓扑结构,我们在小于0.045 fm的格位间距处检查。 我们还推广这种方法,为边界条件下的进化设计定制的随机规范化流,在纯随机的非平衡方法方面获得卓越的性能,并为更高效的未来基于流的解决方案铺平道路。
我们实现了四维反射性多顶点三角测量的遗传算法,通过Batyrev的构造诱导Calabi-Yau三倍的超表面。 我们证明,这种算法有效地优化了物理可观测值,如轴子衰变常数或弦理论压实中的轴-光子耦合。 对于我们的实现,我们选择三角测量的参数化,通过延长双面的精细,定期三角测量,产生同源不等效的Calabi-Yau三倍,从而消除从多面三角测量到Calabi-Yau超表面的地图中的指数大冗余因子。 特别是,我们讨论了这种编码如何使整个Kreuzer-Skarke列表适应各种优化策略,包括但不限于遗传算法。 为了实现最佳性能,我们使用贝叶斯优化调整了遗传算法的超参数。 我们发现我们的实施大大优于其他采样和优化策略,如Markov Chain Monte Carlo或Simulated Annealing。 最后,我们展示我们的遗传算法即使在Hodge数字h^1,1 = 491的最大多管中也能有效地进行优化,我们用它来最大化轴子光子耦合。
我们证明,当布朗桥在物理上被限制为正典时,它的时间演变与高斯分布统计流形上的m-geodesic相同。 这一发现提供了强有力的证据,表明类似于广义相对论,其中自由粒子遵循大地测量学,纯粹的随机过程也遵循信息几何形状定义的“直线”。 这种几何原理是信息几何固有的双平面结构的直接后果,源于信息“距离”(多样性)的不对称性,导致度量兼容性的违反。 我们的研究结果为随机性提供了几何基础,并为信息等价原理打开了大门。
如今,高能物理(HEP)在其实验和现象学研究中,已经出现了越来越多的趋势,将机器学习(ML)及其专门分支深度学习(DL)纳入其中。 本综述论文使用不同的ML和DL方法对这些应用程序进行了彻底的说明。 本文的第一部分研究了各种粒子物理类型的基础知识,并建立了评估粒子物理学和现有学习模型的指导方针。 接下来,提供了详细的分类,用于表示在高能碰撞中重建的喷气机,主要是在定义明确的光束能量下的质子-质子碰撞中。 本节涵盖各种数据集、预处理技术以及特征提取和选择方法。 提出的技术可以应用于未来的强子-强子对撞机(HHC),如高光度LHC(HL-LHC)和未来圆形对撞机 - 强子-强子(FCChh)。 然后,作者探索了几种专门为HEP中的图像和点云(PC)数据设计的AI技术分析。 此外,还仔细研究了与强子碰撞中的Jet标记相关的分类。 在这篇评论中,研究了ML和DL中各种最先进的(SOTA)技术,重点是它们对HEP需求的影响。 更准确地说,这个讨论涉及各种应用,如Jet标记,Jet跟踪,粒子分类等。 审查结束时,使用DL方法分析了HEP的当前状态。 它强调了未来研究的挑战和潜在领域,每个应用都有说明。
经典的深度神经网络可以在对撞机数据中学习丰富的多粒子相关性,但它们的归纳偏差很少锚定在物理结构中。 我们提出了量子信息神经网络(QINNs),这是一个将量子信息概念和量子可观测值引入纯经典模型的一般框架。 虽然框架是广泛的,但在本文中,我们研究了一个将每个粒子编码为量子比特的具体实现,并使用量子费舍尔信息矩阵(QFIM)作为粒子相关性的紧凑,独立于基础的总结。 使用喷射标记作为案例研究,QFIMs在图形神经网络中充当轻量级嵌入,提高了模型的表达性和可塑性。 QFIM揭示了QCD和具有与物理期望一致的强射机的不同模式。 因此,QINN为量子知识分析(即断层扫描)提供了一条实用、可解释和可扩展的途径,特别是通过增强完善的深度学习方法。
我们通过考虑所谓的约束最小超对称标准模型(CMSSM),证明了符号回归(SR)对探测粒子物理学模型(BSM)的功效。 像BSM物理学的许多化身一样,该模型具有数(四个)任意参数,这些参数决定了实验信号,以及暗物质遗迹密度等宇宙学可观测值。 我们表明,通过使用输入参数的可观测值的符号表达式,可以大大加快对现象学的分析。 在这里,我们关注希格斯质量,寒冷的暗物质遗迹密度,以及对μ子异常磁矩的贡献。 我们发现SR可以产生非常准确的表达式。 使用它们,我们使全局拟合得出CMSSM输入参数的后概率密度,这些参数与使用传统方法执行参数的后置概率密度一致。 此外,我们展示了SR的一个主要优势,即使用可微方法而不是采样方法进行拟合的能力。 我们还比较了该方法与神经网络(NN)回归。 SR产生更全球稳健的结果,而NN需要专注于有前途的区域的数据,以便具有同等的性能。
我们表明轴流密度是量子内在轨道角动量(IOAM)的物理起源(生成器)。 没有轴流,粒子的IOAM就会消失。 从广义上讲,我们认为轴流密度的螺旋或干扰特性决定了任何时空依赖量子系统中非线性或隧道效应的发生。 我们的发现提供了一个全面的理论框架,解决了Keldysh电离理论的局限性,并为量子系统角动量特性提供了新的见解,特别是在隧道主导的机制中。 使用Wigner函数方法,费米奥通用的两级模型和贝瑞相模拟,我们预测IOAM效应即使在纯量子隧道过程中也能持续存在。 这些结果为在未来高强度QED实验中对IOAM效应进行实验验证打开了大门,例如使用X射线自由电子激光器的实验验证。
对于某些维度调节的单环图,二环图和三环图,研究构建epsilon-expansion的问题以及结果的分析延续。 在一些例子中,可以计算epsilon-expansion的任意术语。 对于更复杂的情况,在epsilon中只获得几个更高的术语。 除了单环二点和三点图外,例子还包括双环(主要是空壳)传播器型图和三环真空图。 作为副产品,建立了一些涉及克劳森函数,广义日志-正文积分和某些欧拉-扎吉尔总和的新关系,并提出了一些参数1/4的超几何函数的有用结果。
本综述论文旨在为那些希望在实践中应用离散小波的人提供有用的指南。 微波的概念及其在实际计算和各种应用中的使用被简要描述,但省略了数学语句的严格证明,读者只是参考了相应的文献。 多分辨率分析和快速小波变换成为处理离散小波的标准程序。 正确选择小波和使用非标准矩阵乘法通常对于实现目标至关重要。 在小波的帮助下分析各种功能,可以揭示分形结构,奇点等。 运算符表达式的波段变换有助于解决一些方程。 在实际应用中,人们通常处理离散函数,小波变换的稳定性和相应的数值算法变得很重要。 在讨论所有这些主题后,我们转向小波机械的实际应用。 他们的人数太多,以至于我们必须只通过一些例子来限制自己。 作者将感谢任何评论,这些评论改善了这篇评论论文,使我们更接近摘要第一句中宣布的目标。
我们引入了基于符号回归的机器学习框架,以提取多环Feynman积分的完整符号字母表。 通过针对分析结构而不是减少,该方法广泛适用,可在不同的积分家族中解释。 它成功地在非平凡的例子中重建了完整的符号字母表,展示了稳健性和一般性。 除了加速计算案例之外,它还普遍揭示了分析结构。 该框架为多回路振幅分析开辟了新的途径,并为探索散射振幅提供了多功能工具。
我们提出了一个基于强化学习的搜索策略,以探索标准模型之外的新物理学。 强化学习是机器学习方法之一,是一种强大的方法来找到具有现象学约束的模型参数。 作为具体的例子,我们专注于具有全局U(1)风味对称性的最小轴向模型。 学习的代理成功地找到了U(1)电荷分配的夸克和瘦子解决风味和宇宙学难题在标准模型中,并找到超过150个现实的夸克部门的现实解决方案,考虑到再正常化效应。 对于基于强化学习的分析发现的解决方案,我们讨论了未来实验对检测轴子的敏感性,该轴子是自发破碎U(1)的Nambu-Goldstone玻色子。 我们还研究了基于强化学习的搜索方法与传统优化方法相比,找到最佳离散参数的速度。 总之,基于强化学习策略的高效参数搜索使我们能够从 flavor 对与轴子模型相关的庞大参数空间进行统计分析。
符号回归(SR),从数据中自动发现数学表达式,是科学探究的基石。 然而,它经常受到搜索空间的组合爆炸和过度拟合趋势的阻碍。 植根于遗传编程的流行方法,通过语法方式探索这个空间,通常产生过于复杂,不可解释的模型。 本文介绍了IdeaSearchFitter,这是一个在进化搜索中使用大语言模型(LLM)作为语义运算符的框架。 通过生成以自然语言原理为指导的候选人表达式,我们的方法将发现偏向于不仅准确而且概念上连贯和可解释的模型。 我们展示了IdeaSearchFitter在各种挑战中的功效:它在Feynman符号回归数据库(FSReD)上实现了具有竞争力的,噪音强劲的性能,优于几个强大的基线;在真实世界的数据中发现了具有良好准确性复杂性权衡的机械对齐模型;并在前沿高能物理应用中为Parton分布函数提供紧凑,物理激励的参数化。 IdeaSearchFitter是我们更广泛的迭代代理框架IdeaSearch中的专门模块,可在https://www.ideasearch.cn/上公开。
高能核物理的一个核心挑战是从重离子碰撞(HIC)的高维最终状态数据中提取信息特征,以便进行可靠的下游分析。 传统方法通常依赖于选定的可观察物,这可能会错过数据中微妙但物理相关的结构。 为了解决这个问题,我们引入了一个基于Transformer的自动编码器,该自动编码器具有两个阶段的范式:自我监督的预训练,然后进行监督微调。 预训练的编码器直接从未标记的HIC数据中学习潜在表示,提供了一个紧凑且信息丰富的功能空间,可以适应不同的物理任务。 作为案例研究,我们应用该方法来区分大型和小型碰撞系统,其实现比PointNet显着更高的分类精度。 主要成分分析和SHAP解释进一步证明,自动编码器捕获了单个可观测值以外的复杂非线性相关性,具有强大的判和解释力。 这些结果建立了我们的两阶段框架,作为HIC特征学习的一般和强大的基础,为对夸克 - 胶子等离子体特性和其他新兴现象进行更强大的分析打开了大门。 可在https://github.com/Giovanni-Sforza/MaskPoint-AMPT上公布。
深度学习在喷射分类任务中取得了显着的成功,但一个关键的挑战仍然存在:了解这些模型的学习内容以及它们的特征如何与已知的QCD可观测物相关联。 提高可解释性对于在对撞机物理中构建稳健和值得信赖的机器学习工具至关重要。 为了应对这一挑战,我们研究了用于夸克-胶子歧视的图形神经网络,系统地纳入了物理动机的归纳偏差。 特别是,我们设计的消息传递架构,强制执行红外和共线性(IRC)安全,以及在快速-阿齐穆斯平面中的E(2)和O(2)等距。 使用模拟喷气式数据集,我们将这些网络与分类性能、稳健性与软排放的稳健性以及潜在表示结构的无约束基线进行比较。 我们的分析表明,物理感知网络在训练实例中更加稳定,并在多个可解释的方向上分配其潜在方差。 通过将能量流多项式回归到主要组件上,我们在学习表示和已建立的IRC安全喷气天文台之间建立了直接对应关系。 这些结果表明,嵌入对称性和安全性约束不仅可以提高稳健性,还可以在已知的QCD结构中提供网络表示,为对撞机物理中的可解释深度学习提供了原则性方法。
继续滚动加载更多