Exploring Multi-view Symbolic Regression methods in physical sciences
Etienne Russeil, Fabrício Olivetti de França, Konstantin Malanchev, Guillaume Moinard, Maxime Cherrey
通过数学函数描述世界行为有助于科学家更好地理解不同现象的内在机制。 传统上,这是通过从第一原理和仔细观察中推导出新的方程来完成的。 现代替代方案是通过符号回归(SR)自动化这一过程的一部分。 SR算法搜索一个功能,该函数在试图强制运算时充分适合观察到的数据,希望生成一个可解释的方程。 这些算法的一个特别有趣的扩展是多视图符号回归(MvSR)。 它搜索了一个参数化函数,能够描述由相同现象产生的多个数据集,这有助于减轻过度拟合和数据稀缺的常见问题。 最近,多个实现为MvSR增加了支持,它们之间的差异很小。 在本文中,我们测试并比较了Opperon,PySR,phy-SO和eggp中支持的MvSR,在不同的现实世界数据集中。 我们表明,它们经常在提出只有少量自由参数的解决方案时达到良好的准确性。 然而,我们发现某些功能可以更频繁地生成更好的模型。 最后,我们为未来MvSR的发展提供指导。
Describing the world behavior through mathematical functions help scientists to achieve a better understanding of the inner mechanisms of different phenomena. Traditionally, this is done by deriving new equations from first principles and careful observations. A modern alternative is to automate part of this process with symbolic regression (SR). The SR algorithms search for a function that adequately fits the observed data while trying to enforce sparsity, in the hopes of generating an interpre...