EPO: Diverse and Realistic Protein Ensemble Generation via Energy Preference Optimization
Yuancheng Sun, Yuxuan Ren, Zhaoming Chen, Xu Han, Kang Liu, Qiwei Ye
准确探索蛋白质构象集合对于发现功能至关重要,但仍然很困难,因为分子动力学(MD)模拟受到高计算成本和能量障碍捕获的影响。 本文介绍了能量偏好优化(EPO),这是一种在线改进算法,将预训练的蛋白质集成生成器变成能量感知采样器,无需额外的MD轨迹。 具体来说,EPO利用随机微分方程采样来探索构象景观,并结合基于列表偏好优化的新型能量排名机制。 至关重要的是,EPO引入了一个实用的上限,以有效地近似连续时间生成模型中长采样轨迹的棘手概率,使其易于适应现有的预训练发电机。 在四肽、ATLAS和快速折叠基准测试中,EPO成功地生成了多样化和物理逼真的集合,在九个评估指标中建立了一个新的最先进的系统。 这些结果表明,仅能量偏好信号可以有效地引导生成模型转向热力学一致的构象集合,为长期MD模拟提供替代方案,并扩大学习潜力在结构生物学和药物发现中的适用性。
Accurate exploration of protein conformational ensembles is essential for uncovering function but remains hard because molecular-dynamics (MD) simulations suffer from high computational costs and energy-barrier trapping. This paper presents Energy Preference Optimization (EPO), an online refinement algorithm that turns a pretrained protein ensemble generator into an energy-aware sampler without extra MD trajectories. Specifically, EPO leverages stochastic differential equation sampling to explor...