42digest首页
脉冲星检测与深度学习

Pulsar Detection with Deep Learning

Manideep Pendyala

arXiv
2025年10月26日

脉冲星调查每次运行产生数百万候选人,压倒性的人工检查。 本文为无线电脉冲星候选选择构建了一条深度学习管道,将阵列衍生的特征与图像诊断融合在一起。 从大约500 GB的巨型Metrewave射电望远镜(GMRT)数据中,原始电压转换为滤波器库(SIGPROC),然后通过试验分散和折叠(PRESTO),以产生大约32,000个候选者。 每个候选者产生四个诊断 - 摘要配置文件,时间与相位,子带与相位和DM曲线 - 代表为数组和图像。 基线堆叠模型(用于阵列的ANN + 用于逻辑回归融合的图像的CNN)的准确率达到68%。 然后,我们改进了 CNN 架构和培训(规范化、学习率调度、最大规范约束),并通过有针对性的增强来缓解类失衡,包括针对少数群体类的基于 GAN 的生成器。 增强的CNN获得87%的准确率;最终的GAN+CNN系统在保持测试集上平衡精度和召回,同时保持足够轻的近实时分诊。 结果表明,将阵列和图像通道结合提高了仅图像方法的可分离性,并且适度的生成增强可以显着提高少数(脉冲星)的回忆。 这些方法是调查无关的,可与即将到来的高通量设施进行扩展。

Pulsar surveys generate millions of candidates per run, overwhelming manual inspection. This thesis builds a deep learning pipeline for radio pulsar candidate selection that fuses array-derived features with image diagnostics. From approximately 500 GB of Giant Metrewave Radio Telescope (GMRT) data, raw voltages are converted to filterbanks (SIGPROC), then de-dispersed and folded across trial dispersion measures (PRESTO) to produce approximately 32,000 candidates. Each candidate yields four diag...