Active Learning for Machine Learning Driven Molecular Dynamics
Kevin Bachelor, Sanya Murdeshwar, Daniel Sabo, Razvan Marinescu
机器学习的粗粒(CG)电位很快,但随着时间的推移,当模拟达到采样不足的生物分子构象时,并产生广泛的所有原子(AA)数据来对抗这一点在计算上是不可行的。 我们提出了一种新的活性学习框架,用于分子动力学(MD)中的CG神经网络电位。 基于CGSchNet模型,我们的方法采用基于MD模拟的根均方差(RMSD)帧选择,以便在神经网络电位训练期间通过查询神谕来生成数据。 该框架保留了CG水平效率,同时精确纠正模型,RMSD确定了覆盖范围差距。 通过训练CGSchNet,一个粗粒神经网络潜力,我们的经验表明,我们的框架探索了以前看不见的配置,并在构象空间的未探索区域上训练模型。 我们的主动学习框架使基于Chignolin蛋白训练的CGSchNet模型能够实现33.05
Machine-learned coarse-grained (CG) potentials are fast, but degrade over time when simulations reach under-sampled bio-molecular conformations, and generating widespread all-atom (AA) data to combat this is computationally infeasible. We propose a novel active learning (AL) framework for CG neural network potentials in molecular dynamics (MD). Building on the CGSchNet model, our method employs root mean squared deviation (RMSD)-based frame selection from MD simulations in order to generate data...