42digest首页
使用内核机器回归确定肺癌药物靶标发现的多组学相互作用

Identifying multi-omics interactions for lung cancer drug targets discovery using Kernel Machine Regression

Md. Imtyaz Ahmed and Md. Delwar Hossain and Md Mostafizer Rahman and Md. Ahsan Habib and Md. Mamunur Rashid and Md. Selim Reza and Md Ashad Alam

arXiv
2025年10月17日

癌症表现出由多方面分子相互作用驱动的多样而复杂的表型。 最近的生物医学研究通过整合多组学数据集(基因组,蛋白质组,转录组,表观基因组)强调了对这些疾病的全面研究。 这种方法提供了一种识别与癌症相关的遗传变异的有效方法,并提供了对疾病如何发展和扩散的更深入了解。 然而,与单一组学相比,理解多组学数据集特征之间的复杂相互作用具有挑战性。 在本文中,我们分析了来自The Cancer Genome Atlas(TCGA)的肺癌多组学数据集。 使用四种统计方法,LIMMA,T测试,Canonical Correlation Analysis(CCA)和Wilcoxon测试,我们确定了跨基因表达,DNA甲基化和miRNA表达数据的差异表达基因。 然后,我们使用内核机器回归(KMR)方法集成了这些多组学数据。 我们的发现揭示了三种组学组学之间的显著相互作用:基因表达,miRNA表达和肺癌中的DNA甲基化。 从我们的数据分析中,我们确定了38个与肺癌有显著关联的基因。 从我们的数据分析中,我们确定了38个与肺癌有显著关联的基因。 其中,排名最高的8个基因(PDGFRB、PDGFRA、SNAI1、ID1、FGF11、TNXB、ITGB1、ZIC1)通过严格的统计分析凸显出来。 此外,在二氧化硅研究中确定了三种顶级的潜在候选药物(Selinexor,Orapred和Capmatinib),这些药物可能在肺癌的治疗中发挥关键作用。 这些药物也得到了其他独立研究结果的支持,这些研究强调了其在对抗肺癌方面的潜在功效。

Cancer exhibits diverse and complex phenotypes driven by multifaceted molecular interactions. Recent biomedical research has emphasized the comprehensive study of such diseases by integrating multi-omics datasets (genome, proteome, transcriptome, epigenome). This approach provides an efficient method for identifying genetic variants associated with cancer and offers a deeper understanding of how the disease develops and spreads. However, it is challenging to comprehend complex interactions among...