活水快报 - 42Digest

从欧拉到今天:通用数学可谬误对ArXiv论文中的错误进行大规模计算分析

From Euler to Today: Universal Mathematical Fallibility A Large-Scale Computational Analysis of Errors in ArXiv Papers

Igor Rivin

arXiv

2025年11月4日

我们介绍了来自ArXiv存储库的数学论文的大规模计算分析的结果,展示了一个全面的系统,该系统不仅可以检测数学错误,还可以提供完整的裁判报告和期刊级推荐。我们的自动化分析系统处理了多个数学类别的37,000多篇论文,揭示了显著的错误率和质量分布。值得注意的是,该系统确定了跨越三个世纪数学的论文中的错误,包括Leonhard Euler(1707-1783)和Peter Gustav Lejeune Dirichlet(1805-1859)的作品,以及当代菲尔兹奖章获得者。在数值分析(math.NA)中,我们观察到错误率为9.6%(23,761篇论文中2,271个错误),而几何拓扑(math.GT)显示6.5%(13,209篇论文中有862个错误)。引人注目的是,类别理论(math.CT)在分析的93篇论文中显示0%的错误,有证据表明这些结果“更容易”用于自动化分析。除了错误检测外,该系统还评估了期刊适用性的论文,为顶级通才期刊推荐了0.4%的论文,为顶级现场特定期刊推荐了15.5%的论文,并在专业场地对其余论文进行分类。这些发现既证明了所有时代数学错误的普遍性,也证明了大规模自动化综合数学同行评审的可行性。这项工作表明,该方法虽然适用于数学,但与学科无关,可以很容易地扩展到物理,计算机科学和ArXiv存储库中代表的其他领域。

We present the results of a large-scale computational analysis of mathematical papers from the ArXiv repository, demonstrating a comprehensive system that not only detects mathematical errors but provides complete referee reports with journal tier recommendations. Our automated analysis system processed over 37,000 papers across multiple mathematical categories, revealing significant error rates and quality distributions. Remarkably, the system identified errors in papers spanning three centurie...

历史与综述人工智能数字图书馆

View Source