When is a System Discoverable from Data? Discovery Requires Chaos
Zakhar Shumaylov, Peter Zaika, Philipp Scholl, Gitta Kutyniok, Lior Horesh, Carola-Bibiane Schönlieb
深度学习革命刺激了在科学中使用人工智能的进步。 在物理科学中,主要重点是从观测数据中发现动态系统。 然而,学习代理和符号模型的可靠性往往被非独特性的根本问题所破坏。 生成的模型可能完全适合可用数据,但缺乏真正的预测能力。 这就提出了一个问题:在什么条件下,从一组有限的观测中可以唯一地识别管辖方程的系统? 我们反直觉地表明,通常与不可预测性相关的混乱对于确保系统在连续或分析功能的空间中被发现至关重要。 基准数据集中混沌系统的流行可能无意中掩盖了这一基本限制。 更具体地说,我们表明,在其整个域上混沌的系统可以从连续函数空间内的单个轨迹中被发现,在吸引器的几何条件下,在一个奇怪的吸引器上混沌的系统在分析上是可分析发现的。 因此,我们首次证明经典的洛伦兹系统在分析上是可发现的。 此外,我们确定,在第一个整体的存在下,分析可发现性是不可能的,在现实世界中系统中很常见。 这些发现有助于解释数据驱动方法在天气预报等固有混乱领域的成功,同时揭示了数字孪生等工程应用的重大挑战,需要稳定,可预测的行为。 对于这些非混杂系统,我们发现,虽然仅凭轨迹数据是不够的,但某些先前的物理知识可以帮助确保可发现性。 这些发现需要批判性地重新评估支撑纯粹数据驱动发现的基本假设。
The deep learning revolution has spurred a rise in advances of using AI in sciences. Within physical sciences the main focus has been on discovery of dynamical systems from observational data. Yet the reliability of learned surrogates and symbolic models is often undermined by the fundamental problem of non-uniqueness. The resulting models may fit the available data perfectly, but lack genuine predictive power. This raises the question: under what conditions can the systems governing equations b...