MiniFool – Physics-Constraint-Aware Minimizer-Based Adversarial Attacks in Deep Neural Networks
Lucie Flek, Oliver Janik, Philipp Alexander Jung, Akbar Karimi, Timo Saala, Alexander Schmidt, Matthias Schott, Philipp Soldin, Matthias Thiesmeyer, Christopher Wiebusch, Ulrich Willemsen
在本文中,我们提出了一种新的算法MiniFool,它实现了物理启发的对抗攻击,用于测试粒子和星射物理学中基于神经网络的分类任务。 虽然我们最初用IceCube Neutrino天文台开发了用于搜索天体物理tau中微子的算法,但我们将其应用于其他科学领域的进一步数据,从而证明了其普遍适用性。 在这里,我们将该算法应用于著名的MNIST数据集,此外,还可以从大型强子对撞机的CMS实验中打开数据数据。 该算法基于最小化成本函数,该函数将基于测试统计的χ^2与偏离预期目标分数相结合。 测试统计量根据实验的不确定性量化应用于数据扰动的概率。 对于我们研究的用例,我们发现翻转分类的可能性在最初正确和不正确分类的事件上有所不同。 当测试分类的变化作为扩展实验不确定性的攻击参数的函数时,可以量化网络决策的稳健性。 此外,这允许测试未标记的实验数据分类的稳健性。
In this paper, we present a new algorithm, MiniFool, that implements physics-inspired adversarial attacks for testing neural network-based classification tasks in particle and astroparticle physics. While we initially developed the algorithm for the search for astrophysical tau neutrinos with the IceCube Neutrino Observatory, we apply it to further data from other science domains, thus demonstrating its general applicability. Here, we apply the algorithm to the well-known MNIST data set and furt...