AdaptMol: Adaptive Fusion from Sequence String to Topological Structure for Few-shot Drug Discovery
Yifan Dai (1), Xuanbai Ren (1), Tengfei Ma (1), Qipeng Yan (2), Yiping Liu (1), Yuansheng Liu (1), Xiangxiang Zeng (1) ((1) College of Computer Science and Electronic Engineering, Hunan University, (2) School of Biomedical Science, Hunan University)
准确的分子特性预测(MPP)是现代药物开发的关键一步。 然而,实验验证数据的稀缺性对人工智能驱动的研究范式构成了重大挑战。 在很少见的学习情景下,分子表示的质量直接决定了模型性能的理论上限。 我们介绍了AdaptMol,一个集成了用于分子表示的自适应多模态融合的典型网络。 该框架采用双层注意力机制,动态整合源自两种模式的全球和局部分子特征:SMILES序列和分子图。 (1)在局部层面,原子相互作用和亚结构等结构特征从分子图中提取,强调细粒度拓扑信息;(2)在全球层面,SMILES序列提供了分子的整体表示。 为了验证多模态自适应聚变的必要性,我们提出了一个基于识别分子活性子结构的可解释方法,以证明多模态自适应融合可以有效地代表分子。 在5次拍摄和10次设置下对三个常用基准进行的广泛实验表明,在大多数情况下,AdaptMol 达到了最先进的性能。 理由提取方法指导两种模式的融合,并强调了这两种方式的重要性。
Accurate molecular property prediction (MPP) is a critical step in modern drug development. However, the scarcity of experimental validation data poses a significant challenge to AI-driven research paradigms. Under few-shot learning scenarios, the quality of molecular representations directly dictates the theoretical upper limit of model performance. We present AdaptMol, a prototypical network integrating Adaptive multimodal fusion for Molecular representation. This framework employs a dual-leve...