42digest首页
基于模拟的预训练和基于天文时间序列的域适应,具有最小标签数据

Simulation-Based Pretraining and Domain Adaptation for Astronomical Time Series with Minimal Labeled Data

Rithwik Gupta, Daniel Muthukrishna, Jeroen Audenaert

arXiv
2025年10月14日

天文时间序列分析面临一个关键限制:标记观测数据的稀缺性。 我们提出了一种利用模拟的预训练方法,大大减少了从真实观察中标记示例的需求。 我们的模型基于多个天文调查(ZTF和LSST)的模拟数据进行训练,学习可有效转移到下游任务的可推广表示。 使用基于分类器的架构,通过对比和对抗性目标进行增强,我们创建了与域无关的模型,这些模型在分类、红移估计和异常检测中,以最小的真实数据进行微调时,在分类、红移估计和异常检测方面表现出与基线方法相比的显著性能改进。 值得注意的是,我们的模型表现出有效的零射位传输能力,在仅根据现有望远镜(ZTF)数据进行训练时,在未来的望远镜(LSST)模拟中实现了可比性能。 此外,他们推广到非常不同的天文现象(即美国宇航局开普勒望远镜的变星),尽管接受了瞬态事件的训练,展示了跨领域的能力。 我们的方法为在标记数据稀缺时构建一般模型提供了实用解决方案,但领域知识可以在模拟中编码。

Astronomical time-series analysis faces a critical limitation: the scarcity of labeled observational data. We present a pre-training approach that leverages simulations, significantly reducing the need for labeled examples from real observations. Our models, trained on simulated data from multiple astronomical surveys (ZTF and LSST), learn generalizable representations that transfer effectively to downstream tasks. Using classifier-based architectures enhanced with contrastive and adversarial ob...