Discovering Interpretable Biological Concepts in Single-cell RNA-seq Foundation Models
Charlotte Claye (MICS), Pierre Marschall, Wassila Ouerdane (MICS), Céline Hudelot (MICS), Julien Duquesne
单细胞RNA-seq基础模型在下游任务上取得了强劲的性能,但仍然是黑匣子,限制了它们用于生物发现的效用。 最近的研究表明,稀疏的词典学习可以从深度学习模型中提取概念,在生物医学成像和蛋白质模型中具有有希望的应用。 然而,解释生物学概念仍然具有挑战性,因为生物序列本质上并不是人类可解释的。 我们为单细胞RNA-seq模型引入了一种新的基于概念的可解释性框架,重点是概念解释和评估。 我们提出了一种具有反事实扰动的归因方法,该方法可识别影响概念激活的基因,超越诸如差分表达分析等相关方法。 然后,我们提供两种互补的解释方法:由交互式界面促进的专家驱动的分析,以及基于归因的生物通路富集的本体论驱动方法。 将我们的框架应用于文献中两个着名的单细胞RNA-seq模型,我们解释了由在两个免疫细胞数据集上训练的Top-K稀疏自动编码器提取的概念。 通过免疫学领域专家,我们表明,与单个神经元相比,概念提高了可解释性,同时保持了潜在表征的丰富性和信息性。 这项工作为解释生物知识基础模型编码的内容提供了一个原则框架,为它们用于假设生成和发现铺平了道路。
Single-cell RNA-seq foundation models achieve strong performance on downstream tasks but remain black boxes, limiting their utility for biological discovery. Recent work has shown that sparse dictionary learning can extract concepts from deep learning models, with promising applications in biomedical imaging and protein models. However, interpreting biological concepts remains challenging, as biological sequences are not inherently human-interpretable. We introduce a novel concept-based interpre...