42digest首页
SPECTRA:用于不平衡分子属性回归的光谱靶点感知图增强

SPECTRA: Spectral Target-Aware Graph Augmentation for Imbalanced Molecular Property Regression

Brenda Nogueira, Meng Jiang, Nitesh V. Chawla, Nuno Moniz

arXiv
2025年11月6日

在分子属性预测中,最有价值的化合物(例如,高效力)往往占据目标空间的稀疏区域。 标准图谱神经网络(GNN)通常针对平均误差进行优化,在这些罕见但关键的情况下表现不佳,现有的过度采样方法经常扭曲分子拓扑。 在本文中,我们介绍了SPECTRA,一个光谱目标感知图增强框架,可在光谱域中生成逼真的分子图。 SPECTRA(i)从SMILES重建多属性分子图;(ii)通过(熔融)Gromov-Wasserstein耦合物对齐,以获得节点对应;(iii)在稳定的共享基数中插值拉普拉斯特征值,特征向量和节点特征;和(iv)重建边缘,以合成物理上合理的中间体与插值目标。 稀有意识的预算编制方案,源自对标签的内核密度估计,在数据稀缺的地方集中增强。 再加上使用边缘感知的Chebyshev卷积的光谱GNN,SPECTRA在不降低全球准确性的情况下使代表性不足的区域致密化。 在基准测试中,SPECTRA持续改善相关目标范围的错误,同时保持具有竞争力的整体MAE,并产生可解释的合成分子,其结构反映了底层光谱几何。 我们的结果表明,光谱,几何感知增强是不平衡分子属性回归的有效和高效的策略。

In molecular property prediction, the most valuable compounds (e.g., high potency) often occupy sparse regions of the target space. Standard Graph Neural Networks (GNNs) commonly optimize for the average error, underperforming on these uncommon but critical cases, with existing oversampling methods often distorting molecular topology. In this paper, we introduce SPECTRA, a Spectral Target-Aware graph augmentation framework that generates realistic molecular graphs in the spectral domain. SPECTRA...