Learning the symmetric group: large from small
Max Petschack, Alexandr Garbali and Jan de Gier
机器学习探索可以在解决纯数学难题方面取得重大进展。 这种方法的一个优点是数学数据集不会受到噪声的影响,但挑战在于训练这些模型所需的数据量,并且这些数据的计算成本很高。 主要挑战进一步包括难以对统计模型进行后验解释和深入和抽象的数学问题的实现。 我们提出了一种可扩展任务的方法,通过这种方法,在任务的简单版本上训练的模型可以推广到完整的任务。 具体来说,我们证明,一个训练用于预测对称组S_10中一般换位形成的单词排列的变压器神经网络可以以接近100%的精度向对称组S_25进行概括。 我们还表明,如果我们只使用相邻的换位,S_10泛化到具有类似性能的S_16。 我们使用身份增强作为管理可变字长度的关键工具,以及用于相邻换位训练的分区窗口。 最后,我们比较使用的方法的变体,并讨论将该方法扩展到其他任务的潜在挑战。
Machine learning explorations can make significant inroads into solving difficult problems in pure mathematics. One advantage of this approach is that mathematical datasets do not suffer from noise, but a challenge is the amount of data required to train these models and that this data can be computationally expensive to generate. Key challenges further comprise difficulty in a posteriori interpretation of statistical models and the implementation of deep and abstract mathematical problems. We p...