scMEDAL for the interpretable analysis of single-cell transcriptomics data with batch effect visualization using a deep mixed effects autoencoder
Aixa X. Andrade, Son Nguyen, Austin Marckx and Albert Montillo
单细胞RNA测序能够对细胞异质性进行高分辨率分析,但将生物信号从批次效应中分离出来仍然是一个重大挑战。 现有的批次校正算法会抑制或丢弃与批次相关的变体,而不是对其进行建模。 我们提出了ssMEDAL,单细胞混合效应深度自动编码器学习,一个使用两个互补子网络单独建模批量不变和批次特定效应的框架。 主要创新,scMEDAL-RE,是一种随机效应贝叶斯自动编码器,它学习批次特异性表示,同时保留与批次效应信号混淆的生物有意义的信息,这些信息经常在标准校正下丢失。 与之相补充的是,通过对抗性学习训练的固定效应子网络 scMEDAL-FE 提供了一个默认的批次校正组件。 不同条件(自闭症,白血病,心血管),细胞类型以及技术和生物学效应的评估表明,scMEDAL-RE产生可解释的,批次特异性嵌入,补充scMEDAL-FE和既定的纠正方法(scVI,Scorama,Harmony,SAUCIE),更准确地预测疾病状态,供体组和组织。 scMEDAL还提供生成可视化,包括反事实重建。 该框架允许将固定效果组件替换为其他校正方法,同时保留 scMEDAL-RE 增强的预测能力与可视化。 总体而言,ssmedal是一个多功能的,可解释的框架,补充现有的校正,提供了对蜂窝异质性和数据采集的增强洞察力。
Single-cell RNA sequencing enables high-resolution analysis of cellular heterogeneity, yet disentangling biological signal from batch effects remains a major challenge. Existing batch-correction algorithms suppress or discard batch-related variation rather than modeling it. We propose scMEDAL, single-cell Mixed Effects Deep Autoencoder Learning, a framework that separately models batch-invariant and batch-specific effects using two complementary subnetworks. The principal innovation, scMEDAL-RE,...