GraViT: Transfer Learning with Vision Transformers and MLP-Mixer for Strong Gravitational Lens Discovery
René Parlange, Juan C. Cuevas-Tello, Octavio Valenzuela, Omar de J. Cabrera-Rosas, Tomás Verdugo, Anupreeta More and Anton T. Jaelani
引力透镜为暗物质的特性提供了强大的探针,对于推断宇宙学参数至关重要。 空间和时间的遗产调查(LSST)预计将在未来十年找到O(10^5)引力透镜,要求自动分类器。 在这项工作中,我们引入了GraViT,这是一种用于引力透镜检测的PyTorch管道,它利用了最先进的视觉变压器(ViT)模型和MLP-Mixer的广泛预训练。 我们通过检查数据质量(源和样本量)、模型架构(选择和微调)、训练策略(增强、规范化和优化)和集成预测来评估迁移学习对分类性能的影响。 这项研究在先前对神经网络的系统比较中再现了实验,并提供了对该常见测试样品上强引力透镜可探测性的见解。 我们使用HOLISMOKES VI和SuGOHI X的数据集对十个架构进行微调,并将其与卷积基线进行基准测试,讨论复杂性和推理时间分析。
Gravitational lensing offers a powerful probe into the properties of dark matter and is crucial to infer cosmological parameters. The Legacy Survey of Space and Time (LSST) is predicted to find O(10^5) gravitational lenses over the next decade, demanding automated classifiers. In this work, we introduce GraViT, a PyTorch pipeline for gravitational lens detection that leverages extensive pretraining of state-of-the-art Vision Transformer (ViT) models and MLP-Mixer. We assess the impact of transfe...