GastroDL-Fusion: A Dual-Modal Deep Learning Framework Integrating Protein-Ligand Complexes and Gene Sequences for Gastrointestinal Disease Drug Discovery
Ziyang Gao, Annie Cheung, Yihao Ou
蛋白质配体结合亲和力的准确预测在加速发现新药和疫苗方面起着关键作用,特别是对于胃肠道(GI)疾病,如胃溃疡,克罗恩病和溃疡性结肠炎。 传统的计算模型通常仅依靠结构信息,因此无法捕获影响疾病机制和治疗反应的遗传决定因素。 为了解决这一差距,我们提出了GastroDL-Fusion,这是一个双模态深度学习框架,它将蛋白质配体复杂数据与疾病相关的基因序列信息集成在一起,用于药物和疫苗开发。 在我们的方法中,蛋白质配体复合物被表示为分子图,并使用图谱异构网络(GIN)建模,而基因序列则通过预训练的变形金刚(ProtBERT / ESM)编码成具有生物学意义的嵌入。 这些互补模式通过多层感知器融合,以实现强大的跨模态交互学习。 我们根据GI疾病相关目标的基准数据集评估模型,证明GastroDL-Fusion比传统方法显着提高了预测性能。 具体来说,该模型实现了1.12的平均绝对误差(MAE)和1.75的根均方误差(RMSE),优于CNN,BiLSTM,GIN和仅限变形金刚的基线。 这些结果证实,结合结构和遗传特征可以更准确地预测结合亲和力,为加速在胃肠道疾病背景下的靶向疗法和疫苗的设计提供可靠的计算工具。
Accurate prediction of protein-ligand binding affinity plays a pivotal role in accelerating the discovery of novel drugs and vaccines, particularly for gastrointestinal (GI) diseases such as gastric ulcers, Crohn's disease, and ulcerative colitis. Traditional computational models often rely on structural information alone and thus fail to capture the genetic determinants that influence disease mechanisms and therapeutic responses. To address this gap, we propose GastroDL-Fusion, a dual-modal dee...