Stable and Interpretable Jet Physics with IRC-Safe Equivariant Feature Extraction
Partha Konar, Vishal S. Ngairangbam, Michael Spannowsky, and Deepanshu Srivastava
深度学习在喷射分类任务中取得了显着的成功,但一个关键的挑战仍然存在:了解这些模型的学习内容以及它们的特征如何与已知的QCD可观测物相关联。 提高可解释性对于在对撞机物理中构建稳健和值得信赖的机器学习工具至关重要。 为了应对这一挑战,我们研究了用于夸克-胶子歧视的图形神经网络,系统地纳入了物理动机的归纳偏差。 特别是,我们设计的消息传递架构,强制执行红外和共线性(IRC)安全,以及在快速-阿齐穆斯平面中的E(2)和O(2)等距。 使用模拟喷气式数据集,我们将这些网络与分类性能、稳健性与软排放的稳健性以及潜在表示结构的无约束基线进行比较。 我们的分析表明,物理感知网络在训练实例中更加稳定,并在多个可解释的方向上分配其潜在方差。 通过将能量流多项式回归到主要组件上,我们在学习表示和已建立的IRC安全喷气天文台之间建立了直接对应关系。 这些结果表明,嵌入对称性和安全性约束不仅可以提高稳健性,还可以在已知的QCD结构中提供网络表示,为对撞机物理中的可解释深度学习提供了原则性方法。
Deep learning has achieved remarkable success in jet classification tasks, yet a key challenge remains: understanding what these models learn and how their features relate to known QCD observables. Improving interpretability is essential for building robust and trustworthy machine learning tools in collider physics. To address this challenge, we investigate graph neural networks for quark-gluon discrimination, systematically incorporating physics-motivated inductive biases. In particular, we des...