Decoding the dark proteome: Deep learning-enabled discovery of druggable enzymes in Wuchereria bancrofti
Shawnak Shivakumar, Jefferson Hernandez
Wuchereria Bancrofti是负责淋巴丝虫病的寄生蛔虫,在39个国家永久禁用超过3600万人,并使6.57亿人处于危险之中。 药物发现的一个主要瓶颈是超过90%的W. Bancrofti深色蛋白质组缺乏功能注释,导致许多潜在目标不明。 在这项工作中,我们提出了一种新的计算管道,将W. Bancrofti的未注释氨基酸序列数据转换为精确的四级酶委员会(EC)数字和候选药物。 我们使用Detection TRansformer来估计酶功能的概率,在4476个标记的寄生虫蛋白上微调了分层近邻EC预测器,并应用排斥采样仅保留四级EC分类,100%置信度。 这条管道将精确的EC数分配给14,772个以前未表征的蛋白质,并发现了W. bancrofti中以前不知道的543个EC类。 强调寄生虫特异性靶点,化学可牵引性,生化重要性和生物合理性的定性分诊在五个独立的策略中优先考虑六种酶:抗Wolbachia细胞壁抑制,蛋白质解阻断,传播中断,咽淀物免疫干扰和cGMP信号破坏稳定。 我们从ChEMBL和BindingDB策划了一个43个复合的库,并与Boltz-2共同折叠了多个蛋白质一致性。 所有六个靶点都表现出至少中等强的预测结合亲和力低于1微摩尔,与peptidoglycan糖基转移酶和NTPase抑制剂的更霉素类似物显示出有希望的纳米摩尔命中和定义良好的结合口袋。 虽然实验验证仍然至关重要,但我们的结果提供了W. Bancrofti深色蛋白质组的第一个大规模功能图谱,并加速了该物种的早期药物开发。
Wuchereria bancrofti, the parasitic roundworm responsible for lymphatic filariasis, permanently disables over 36 million people and places 657 million at risk across 39 countries. A major bottleneck for drug discovery is the lack of functional annotation for more than 90 percent of the W. bancrofti dark proteome, leaving many potential targets unidentified. In this work, we present a novel computational pipeline that converts W. bancrofti's unannotated amino acid sequence data into precise four-...