Solvaformer: an SE(3)-equivariant graph transformer for small molecule solubility prediction
Jonathan Broadbent, Michael Bailey, Mingxuan Li, Abhishek Paul, Louis De Lescure, Paul Chauvin, Lorenzo Kogler-Anele, Yasser Jangjou, Sven Jager
使用材料保存方法准确预测小分子溶解度对于加速合成和过程优化至关重要,但实验测量成本很高,许多学习方法要么依赖于量子衍生描述符,要么提供有限的可解释性。 我们介绍了Solvaformer,一种几何感知图形变压器,将解决方案建模为具有独立SE(3)对称性的多个分子。 该架构将分子内SE(3)等效注意力与分子间标量注意力相结合,可实现跨分子通信,而不会强加虚假的相对几何形状。 我们训练Solvaformer在多任务设置中,以预测溶解度(日志S)和溶解自由能,使用交流批处理方案,训练量子力学数据(CombiSolv-QM)和实验测量(BigSolDB 2.0)。 Solvaformer在学习模型中获得最强的整体性能,并接近DFT辅助梯度增强基线,同时优于EquiformerV2消融和基于序列的替代品。 此外,令牌级注意力产生化学一致性的归因:案例研究恢复已知的分子内与分子间氢粘合模式,这些模式支配位置异构体的溶解度差异。 综上所述,Solvaformer通过将几何感应偏差与互补计算和实验数据的混合数据集训练策略相结合,为解决方案阶段属性预测提供了一种准确、可扩展和可解释的方法。
Accurate prediction of small molecule solubility using material-sparing approaches is critical for accelerating synthesis and process optimization, yet experimental measurement is costly and many learning approaches either depend on quantumderived descriptors or offer limited interpretability. We introduce Solvaformer, a geometry-aware graph transformer that models solutions as multiple molecules with independent SE(3) symmetries. The architecture combines intramolecular SE(3)-equivariant attent...