Completion of partial structures using Patterson maps with the CrysFormer machine learning model
Tom Pan, Evan Dramko, Mitchell D. Miller, Anastasios Kyrillidis, George N. Phillips Jr
蛋白质结构测定长期以来一直是结构生物学的主要挑战之一,深度学习(ML)方法越来越多地被应用。 然而,这些ML模型通常不直接包含实验测量,例如X射线晶体衍射数据。 为此,我们探索了一种更紧密地诠释这些传统晶体学和最近基于ML的方法的方法,通过训练混合3D视觉变压器和卷积网络对这两个领域的输入。 我们使用两个不同的输入结构/Patterson地图,这些图可以直接从晶体学数据中获得,以及从AlphaFold蛋白结构数据库中沉积的预测结构中导出的“部分结构”模板图,随后省略了残留物。 通过这些,我们预测电子密度图,然后通过标准的晶体学精细化过程后处理成原子模型。 介绍从蛋白质数据库条目中提取的小蛋白质片段的初始数据集并将其放置在假设的晶体设置中,我们证明我们的方法在改善晶体结构因子的相位和完成部分结构模板中缺失的区域以及改善电子密度图与地面真理原子结构的一致方面是有效的。
Protein structure determination has long been one of the primary challenges of structural biology, to which deep machine learning (ML)-based approaches have increasingly been applied. However, these ML models generally do not incorporate the experimental measurements directly, such as X-ray crystallographic diffraction data. To this end, we explore an approach that more tightly couples these traditional crystallographic and recent ML-based methods, by training a hybrid 3-d vision transformer and...