Learning conformational ensembles of proteins based on backbone geometry
Nicolas Wolf, Leif Seute, Vsevolod Viliuga, Simon Wagner, Jan Stühmer, Frauke Gräter
最近提出了从玻尔兹曼分布中采样蛋白质构象的深层生成模型,作为通常令人望而却步的分子动力学模拟的替代品。 然而,当前最先进的方法依赖于微调预训练的折叠模型和进化序列信息,限制了它们的适用性和效率,并引入了潜在的偏见。 在这项工作中,我们提出了一个仅基于主干几何形状的采样蛋白质构象的流匹配模型 - BBFlow。 我们引入了骨干平衡结构的几何编码作为输入,并提议不仅对流量进行条件,而且还对各自平衡结构的先验分布进行条件,从而消除了对进化信息的需求。 由此产生的模型比当前最先进的方法更快,可与多链蛋白相转移,并且可以在几天内从头开始训练。 在我们的实验中,我们证明拟议的模型通过减少推理时间来实现竞争性能,不仅跨越了自然存在的蛋白质的既定基准,而且还跨越了新蛋白质,其中进化信息很少或不存在。 BBFlow可在https://github.com/graeter-group/bbflow查阅。
Deep generative models have recently been proposed for sampling protein conformations from the Boltzmann distribution, as an alternative to often prohibitively expensive Molecular Dynamics simulations. However, current state-of-the-art approaches rely on fine-tuning pre-trained folding models and evolutionary sequence information, limiting their applicability and efficiency, and introducing potential biases. In this work, we propose a flow matching model for sampling protein conformations based ...