Decoding Positive Selection in Mycobacterium tuberculosis with Phylogeny-Guided Graph Attention Models
Linfeng Wang, Susana Campino, Taane G. Clark, Jody E. Phelan
积极的选择推动了结核分枝杆菌的适应性突变的出现,塑造了耐药性,传播性和毒力。 植物发育树捕获分离物之间的进化关系,并为检测这种适应性信号提供了自然框架。 我们介绍了一种系统引导图形注意力网络(GAT)方法,引入了一种将SNP注释的系统发育树转换为适合神经网络分析的图形结构的方法。 使用500 M.结核病分离出四种主要谱系和249种单核苷酸变异(84种耐药性相关和165个中性)跨越61个耐药性基因,我们构建了图,其中节点表示分离和边缘反映了系统发育距离。 隔离层之间由七个以上内部节点隔开的边缘被修剪,以强调局部进化结构。 Node 特征编码了 SNP 的存在或不存在,GAT 架构包括两个注意力层、一个剩余连接、全局注意力池和一个多层感知器分类器。 该模型在测试集上实现了0.88的准确率,当应用于146个世卫组织分类的“不确定”变体时,确定了41个在多个谱系中产生收敛的候选者,与适应性演变一致。 这项工作展示了将系统生物学转化为GNN兼容结构的可行性,并强调了基于注意力的模型作为检测积极选择,帮助基因组监测和变体优先级的有效工具。
Positive selection drives the emergence of adaptive mutations in Mycobacterium tuberculosis, shaping drug resistance, transmissibility, and virulence. Phylogenetic trees capture evolutionary relationships among isolates and provide a natural framework for detecting such adaptive signals. We present a phylogeny-guided graph attention network (GAT) approach, introducing a method for converting SNP-annotated phylogenetic trees into graph structures suitable for neural network analysis. Using 500 M....