Interpreting deep learning-based stellar mass estimation via causal analysis and mutual information decomposition
Wei Zhang, Qiufan Lin, Yuan-Sen Ting, Shupei Chen, Hengxin Ruan, Song Li, Yifan Wang
带有多波段星系图像的端到端深度学习模型是强大的数据驱动工具,用于在没有光谱的情况下估计星系物理特性。 然而,由于缺乏可解释性和此类模型的关联性,很难理解集成光度(例如形态学)之外的信息如何有助于估计任务。 改善我们在这一领域的理解将使在解开星系属性之间的物理连接和优化数据利用方面取得进一步进展。 因此,我们的工作旨在通过两种可解释性技术来解释基于深度学习的恒星质量估计:因果分析和相互信息分解。 前者揭示了非定向统计关联以外的多个变量之间的因果路径,而后者量化了不同输入数据对恒星质量估计的多组分贡献(即冗余、唯一性和协同性)。 利用斯隆数字巡天(SDSS)和广域红外巡天探测器(WISE)的数据,我们获得了有意义的结果,为基于图像的模型提供了物理解释。 我们的工作展示了将深度学习与可解释性技术相结合的收益,并有望促进更多数据驱动的天体物理研究(例如,天体物理参数估计和对复杂多变量物理过程的研究)。
End-to-end deep learning models fed with multi-band galaxy images are powerful data-driven tools used to estimate galaxy physical properties in the absence of spectroscopy. However, due to a lack of interpretability and the associational nature of such models, it is difficult to understand how the information that is included in addition to integrated photometry (e.g., morphology) contributes to the estimation task. Improving our understanding in this field would enable further advances into unr...