从欧拉到今天:通用数学可谬误对ArXiv论文中的错误进行大规模计算分析
我们介绍了来自ArXiv存储库的数学论文的大规模计算分析的结果,展示了一个全面的系统,该系统不仅可以检测数学错误,还可以提供完整的裁判报告和期刊级推荐。 我们的自动化分析系统处理了多个数学类别的37,000多篇论文,揭示了显著的错误率和质量分布。 值得注意的是,该系统确定了跨越三个世纪数学的论文中的错误,包括Leonhard Euler(1707-1783)和Peter Gustav Lejeune Dirichlet(1805-1859)的作品,以及当代菲尔兹奖章获得者。 在数值分析(math.NA)中,我们观察到错误率为9.6%(23,761篇论文中2,271个错误),而几何拓扑(math.GT)显示6.5%(13,209篇论文中有862个错误)。 引人注目的是,类别理论(math.CT)在分析的93篇论文中显示0%的错误,有证据表明这些结果“更容易”用于自动化分析。 除了错误检测外,该系统还评估了期刊适用性的论文,为顶级通才期刊推荐了0.4%的论文,为顶级现场特定期刊推荐了15.5%的论文,并在专业场地对其余论文进行分类。 这些发现既证明了所有时代数学错误的普遍性,也证明了大规模自动化综合数学同行评审的可行性。 这项工作表明,该方法虽然适用于数学,但与学科无关,可以很容易地扩展到物理,计算机科学和ArXiv存储库中代表的其他领域。
历史与综述人工智能数字图书馆