天体物理学
Astrophysics
星系天体物理学
Astrophysics of Galaxies
宇宙学与星系外天体物理学
Cosmology and Nongalactic Astrophysics
地球与行星天体物理学
Earth and Planetary Astrophysics
在太阳活动的推动下,地球的太空天气对我们星球周围的卫星以及关键的地面技术基础设施构成了越来越大的风险。 主要的空间天气贡献者是太阳风和日冕物质抛射,其可变密度,速度,温度和磁场使这些结构的自动化分类具有挑战性。 在这项工作中,我们调整了太阳物理学的基础模型,最初在太阳动力学天文台的图像上训练,以创建适合太阳风结构分析的嵌入。 这些嵌入与使用傅里叶特征编码的航天器位置和太阳磁连接相连接,该特征产生了基于神经场的模型。 完整的深度学习架构经过微调,弥合了遥感和现场观测之间的差距。 标签来自Parker Solar Probe测量,形成了一个下游分类任务,将等离子体特性映射到太阳风结构。 虽然整体分类性能适中,可能是由于粗糙的标签,类不平衡和预训练模型的可转移性有限,但这项研究证明了利用基础模型嵌入原位太阳风任务的可行性。 作为第一个概念验证,它为未来改进更可靠的空间天气预报奠定了基础。 本研究中使用的代码和配置文件公开支持可重复性。
太阳能耀斑预测已经进行了广泛的研究,但仍然是一个悬而未决的问题。 在本文中,我们研究了弹性距离测量对检测太阳耀斑数据集SWAN-SF中模式的贡献。 我们采用简单的k-medoids聚类算法来评估高级高维距离指标的有效性。 我们的结果表明,尽管进行了彻底的优化,但没有一个弹性距离比欧几里得距离差。 我们证明,尽管弹性测量已经显示出单变量时间序列的希望,但当应用于SWAN-SF的多变量时间序列时,其特点是太阳活动的高随机性,它们有效地崩溃到欧几里得距离。 我们进行了数千次实验,并提出了定量和定性证据支持这一发现。
在这项研究中,我们推出了一个名为PhyE2E的新AI模型,通过符号回归来发现物理公式。 PhyE2E通过使用神谕神经网络的二阶衍生物将其分解为子问题,简化了符号回归,并使用变压器模型以端到端的方式将数据转换为符号公式。 由此产生的公式通过蒙特卡洛树搜索和遗传编程进行改进。 我们利用大型语言模型合成类似于真实物理学的广泛符号表达式,并训练模型直接从数据中恢复这些公式。 综合评估表明,PhyE2E优于现有的最先进的方法,提供卓越的符号精度,数据拟合精度和物理单元的一致性。 我们将PhyE2E部署到太空物理学的五个应用中,包括太阳黑子数字的预测,太阳旋转角速度,发射线贡献函数,近地等离子体压力和月潮等离子体信号。 人工智能产生的物理公式在拟合卫星和天文望远镜的实验数据方面表现出高度的准确性。 我们成功地升级了1993年NASA提出的关于太阳活动的公式,并首次以明确的形式解释了太阳活动的长周期。 我们还发现,近地等离子体压力的衰减与地球成正比,随后的数学推导与另一项独立研究的卫星数据一致。 r^2 此外,我们发现物理公式可以描述太阳极紫外光谱中发射线,温度,电子密度和磁场之间的关系。 获得的公式与物理学家先前假设它应该具备的特性一致。
标记或分类时间序列是物理科学的一个持续挑战,其中专家注释稀缺,成本高昂,而且往往不一致。 然而,强大的标签对于实现理解、预测和预测的机器学习模型至关重要。 我们介绍了具有人类识别评估的聚类和索引管道(CIPHER),这是一个旨在加速物理学中复杂时间序列的大规模标记的框架。 CIPHER集成了可索引的符号聚合近似(iSAX),用于可解释的压缩和索引,基于密度的聚类(HDBSCAN)来分组反复出现的现象,以及用于高效专家验证的人成环步骤。 代表性样本由域科学家标记,这些注释在集群之间传播,以产生系统,可扩展的分类。 我们评估CIPHER在OMNI数据中分类太阳风现象的任务,这是空间天气研究的核心挑战,表明该框架恢复了有意义的现象,如日冕物质抛射和流相互作用区域。 除了这个案例研究之外,CIPHER还强调了将符号表示,无监督学习和专业知识相结合的一般策略,以解决物理科学中时间序列中的标签稀缺性。 本研究中使用的代码和配置文件公开可用以支持可重复性。
我们提出了一个可扩展的机器学习框架,用于使用分布式处理和量子启发的内核密度矩阵(KDM)方法分析帕克太阳探测器(PSP)太阳风数据。 PSP数据集(2018-2024)超过150 GB,挑战传统的分析方法。 我们的框架利用Dask进行大规模统计计算和KDM来估计关键太阳风参数的单变量和双变量分布,包括太阳风速,质子密度和质子热速,以及每个参数的异常阈值。 我们揭示了内日光层的特征趋势,包括随着距离太阳的增加太阳风速,降低质子密度,以及速度和密度之间的反向关系。 太阳风结构在增强和调解极端空间天气现象方面起着关键作用,并可能引发地磁风暴;我们的分析提供了对这些过程的定量见解。 这种方法提供了一种可处理,可解释和分布式的方法来探索复杂的物理数据集,并促进对大规模现场测量的可重复分析。 处理的数据产品和分析工具已公开提供,以推进太阳能风能动力学和空间天气预报的未来研究。 本研究中使用的代码和配置文件公开可用以支持可重复性。
时间序列是高维度和复杂的数据对象,使得其高效的搜索和索引成为数据挖掘的长期挑战。 基于最近引入的相似性测量,即多尺度杜布距离(MDD),本文研究了其相对于广泛使用的动态时间翘曲(DTW)的相对优势和局限性。 MDD有两种关键方式新颖:它评估跨多个时间尺度的时间序列相似性,并避免点对点对齐。 我们证明,在许多MDD优于DTW的场景中,收益是可观的,我们对其解决的具体性能差距进行了详细分析。 除了来自UCR存档的95个数据集外,我们还提供模拟来测试我们的假设。 最后,我们将这两种方法应用于具有挑战性的现实世界分类任务,并表明MDD比DTW显着改进,强调了其实用性。
天文时间序列分析面临一个关键限制:标记观测数据的稀缺性。 我们提出了一种利用模拟的预训练方法,大大减少了从真实观察中标记示例的需求。 我们的模型基于多个天文调查(ZTF和LSST)的模拟数据进行训练,学习可有效转移到下游任务的可推广表示。 使用基于分类器的架构,通过对比和对抗性目标进行增强,我们创建了与域无关的模型,这些模型在分类、红移估计和异常检测中,以最小的真实数据进行微调时,在分类、红移估计和异常检测方面表现出与基线方法相比的显著性能改进。 值得注意的是,我们的模型表现出有效的零射位传输能力,在仅根据现有望远镜(ZTF)数据进行训练时,在未来的望远镜(LSST)模拟中实现了可比性能。 此外,他们推广到非常不同的天文现象(即美国宇航局开普勒望远镜的变星),尽管接受了瞬态事件的训练,展示了跨领域的能力。 我们的方法为在标记数据稀缺时构建一般模型提供了实用解决方案,但领域知识可以在模拟中编码。
在调查量爆炸的时代,传统的光谱分析方法正在被推到极限。 作为回应,我们开发了Deep-REMAP,这是一种新颖的深度学习框架,利用常规的多任务方法来预测观测光谱的恒星大气参数。 我们在PHOENIX合成光谱库上训练了一个深度卷积神经网络,并使用转移学习来微调MARVELS调查中观察到的FGK矮光谱的一小部分模型。 然后,我们将该模型应用于来自同一调查的732个未表征的FGK巨型候选人。 当在30颗MARVELS校准恒星上验证时,深度REMAP可以准确地恢复有效温度(T_eff),表面重力(记录)和金属性([Fe/H]),例如,在T_eff中实现约75K的精度。 通过将非对称损失函数与嵌入损失相结合,我们的回归即分类框架是可解释的,对参数不平衡的稳健性,并且能够捕获非高斯的不确定性。 虽然为MARVELS开发,但深度REMAP框架可以扩展到其他调查和合成库,展示了恒星表征的强大和自动化途径。
时间序列基础模型(TSFM)越来越多地被作为具有高度能力的通用时间序列表示学习者。 虽然他们的训练语料库很庞大,但他们排除了天文时间序列数据。 对恒星的观测会产生peta-scale时间序列,具有独特的挑战,包括不规则采样和异质性。 我们介绍了StarEmbed,这是第一个对恒星时间序列观测("光曲线")进行先进和标准化评估的严格和标准化评估的公众基准。 我们根据三个科学动机的下游任务进行基准测试:无监督聚类、监督分类和域外源检测。 StarEmbed集成了专家审核的标签目录,以及来自Zwicky Transient Facility的多变量光曲线,产生了分布在七个天体物理类的40k手工标记光曲线。 我们评估三个TSFM(MOIRAI,Chronos,Chronos-Bolt)和一个域特异性变压器(Astromer)的零镜头表示能力,对抗手工制作的特征提取,这是天体物理学文献中长期存在的基线。 我们的结果表明,这些TSFM,特别是Chronos模型,其训练的数据完全不同于天文观测,在某些任务中可以超越既定的天体物理学基线,并有效地推广到全新的数据。 特别是,TSFM在我们的出耗源检测基准上提供最先进的性能。 通过TSFM在天文时间序列数据上的第一个基准,我们测试了其泛化的局限性,并激励了时间域天文学的范式转变,从使用特定任务,完全监督的管道转向采用通用的基础模型表示,用于分析即将发布的天文台的peta规模数据集。
太阳质子事件(SPE)对卫星、宇航员和技术系统造成重大辐射危害。 准确预测其质子通量时间配置文件对于早期预警和缓解至关重要。 本文探讨了基于长期短期记忆网络的深度学习序列到序列(seq2seq)模型,以预测SPE发病后的24小时质子通量配置文件。 我们使用了NOAA GOES观测到的40个连接良好的SPE(1997-2017)的数据集,每个数据集都与一个 >=M 类西半球太阳耀斑和不受干扰的质子通量谱相关联。 使用4倍分层交叉验证,我们在多个预测情景下评估seq2seq模型配置(不同的隐藏单元和嵌入维度):(i)纯质子输入与组合质子+X射线输入,(ii)原始通量数据与趋势平滑数据,以及(iii)自回归与一击预测。 我们的主要结果如下:首先,一击预测持续产生比自回归预测更低的误差,避免了迭代方法中的错误积累。 其次,在原始数据上,仅质子模型优于质子+X射线模型。 然而,随着趋势平滑的数据,这种差距在质子+X射线模型中缩小或逆转。 第三,趋势平滑通过减轻X射线通道的波动,显著增强质子+X射线模型的性能。 第四,虽然根据趋势平滑数据训练的模型平均表现最好,但表现最好的模型是在原始数据上训练的,这表明架构选择有时可能超过数据预处理的好处。
太阳耀斑的预测通常被表述为二元分类任务,根据指定的阈值(例如,大于或等于C级,M级或X级)将事件区分为Flare(FL)或No-Flare(NF)。 然而,这个二进制框架忽略了每个类别(FL和NF)中包含的子类之间的固有序关系。 关于太阳耀斑预测的几项研究从经验上表明,最常见的错误分类发生在这个预测阈值附近。 这表明模型难以区分强度相似但落在二进制阈值相反侧的事件。 为了减轻这种限制,我们提出了一个修改的损失函数,它将二进制耀斑标签子类之间的序信息集成到传统的二进制交叉熵(BCE)损失中。 这种方法是一种具有正则意识,数据驱动的正则化方法,比模型优化期间远离边界的预发素事件更严重地惩罚了靠近预测阈值的照明弹事件的错误预测。 通过将有序加权纳入损失函数,我们的目标是通过利用数据的有序特性来增强模型的学习过程,从而提高其整体性能。
太阳耀斑是太阳系中最具爆炸性的现象,也是从日冕物质抛射开始的事件链的主要触发因素,并导致地磁风暴,可能对地球上的基础设施产生影响。 数据驱动的太阳耀斑预测依赖于深度学习方法,这种方法在操作上很有希望,但具有低可解释性程度,或机器学习算法,它可以提供有关主要影响预测的物理描述符的信息。 本文介绍了一个基于Web的技术平台,用于执行基于特征的机器学习方法的计算管道,提供对耀斑发生的预测,特征排名信息以及预测性能的评估。
低地球轨道(LEO)卫星网络是当今全球通信基础设施的重要组成部分。 尽管正在努力提高其复原力,但在恶劣的空间天气条件下,他们仍然容易受到部件损坏和脱轨的影响。 之前的工作确定了对太阳风暴期间低地卫星网络性能的适度但明显的影响,通常表现为数据包丢失的立即增加和往返时间(RTT)的持续增加。 然而,这些研究只提供了粗粒度的见解,并没有捕捉到整个LEO网络中微妙的空间和时间中断模式。 在本文中,我们深入研究了太阳风暴对LEO卫星通信的影响。 通过在单个卫星和轨道水平上定位大气阻力增加的影响,我们揭示了网络不同部分如何受到影响的显着异质性。 我们发现,不同地区的性能下降程度差异很大,这取决于风暴期间的卫星定位。 具体而言,我们发现(i)并非所有卫星轨道都同样脆弱,(ii)在特定轨道上,某些卫星根据其相对于地磁条件的位置受到不成比例的影响,以及(iii)卫星的自主机动可能是RTT持续增加的原因。 我们的发现揭示了低地轨道卫星星座中以前被忽视的脆弱性模式,并强调需要更具适应性的、具有区域意识的缓解策略,以应对空间天气引起的网络中断。
我们介绍了StrCGAN(恒星循环GAN),这是一种旨在增强低分辨率天文摄影图像的生成模型。 我们的目标是重建天体的高保真地面真实性表示,由于小望远镜观测(如MobilTelesco数据集)的分辨率和质量有限,这项任务具有挑战性。 CycleGAN等传统模型为图像到图像的翻译提供了基础,但仅限于2D映射,并经常扭曲恒星和星系的形态。 为了克服这些限制,我们扩展了CycleGAN框架,具有三个关键创新:3D卷积层以捕获体积空间相关性,多光谱融合以对齐光学和近红外(NIR)域,以及天体物理正则化模块,以保存恒星形态。 跨越光学到NIR的多任务全天空调查的地面真相参考指导了训练过程,确保光谱波段的重建保持一致。 这些组件共同允许StrCGAN生成重建,这些重建不仅视觉更锐利,而且在物理上更一致,在天体物理图像增强的任务中优于标准GAN模型。
在这项研究中,我们使用最先进的图像分类模型对H-Alpha观测中太阳细丝的磁性手性进行分类。 我们在MAGFiLO数据集上建立了第一个太阳丝手性分类的可重复基线。 MAGFiLO数据集包含来自GONG H-Alpha观测的10,000多个手动注释的细丝,使其成为迄今为止最大的长丝检测和分类数据集。 先前的研究依赖于更小的数据集,这限制了它们的可推广性和可比性。 我们微调了几个预先训练的图像分类架构,包括ResNet,WideResNet,ResNeXt和ConvNEXt,还应用数据增强和每类减肥权重来优化模型。 我们的最佳型号ConvNeXtBase在左手性细丝上达到0.69的精度,右手镯细丝的精度为0.73。
大量的太空和地面观测站为天体物理学家提供了前所未有的数据量,这些数据只能使用先进的计算算法进行大规模处理。 因此,确保输入机器学习(ML)模型的数据质量至关重要。 GONG网络的Hα观测代表了这样一个数据流,自2010年以来,每分钟产生几次24/7的观测。 在这项研究中,我们引入了一种轻量级(非ML)异常检测算法,称为H-Alpha异常检测算法,旨在根据用户定义的标准识别异常观测。 与许多黑箱算法不同,我们的方法准确地强调了哪些区域触发了异常标志,并量化了相应的异常可能性。 对于我们的比较分析,我们还创建并发布了2000个观察的数据集,在异常和非异常病例之间平均分配。 我们的结果表明,拟议的模型不仅优于现有方法,而且还提供了可解释性,使领域专家能够进行定性评估。
准确可靠的太阳耀斑预测对于减轻对关键基础设施的潜在影响至关重要。 然而,目前太阳耀斑预报的表现是不够的。 在这项研究中,我们解决了预测未来72小时内预计发生的最大的太阳耀斑类别的任务。 现有方法通常无法充分解决耀斑类的严重类失衡。 为了解决这个问题,我们提出了一个基于多个深态空间模型的太阳耀斑预测模型。 此外,我们引入了频率局部边界感知可靠性损失(FLARE损失),以提高类不平衡下的预测性能和可靠性。 在覆盖整个11年太阳活动周期的多波长太阳图像数据集上进行实验。 因此,我们的方法在Gandin-Murphy-Gerrity评分和真实技能统计方面的表现优于基线方法,这是性能和可靠性的标准指标。
我们提出了一种新的回归任务的间距增强策略,基于通过2层内核机器学习数据自适应内核度量,即形状矩阵。 由此产生的形状矩阵定义了输入空间的Mahalanobis型变形,然后通过特征分解进行因子分解,使我们能够确定特征空间中信息最丰富的方向。 这种数据驱动的方法提供了一个灵活、可解释和准确的特征还原方案。 合成和应用于地磁风暴真实数据集的数字实验表明,我们的方法实现了最小但高度信息化的特征集,而不会失去预测性能。
CLEAN是一种完善的去卷积方法,用于傅里叶成像,同时具有无线电波流和硬X射线能量。 然而,对于硬X射线成像,CLEAN有两个显着的缺点:自动化程度相当有限,以及分辨率不足的倾向。 本文介绍了CLEAN的多尺度版本,专门用于从光谱仪/望远镜观测仪(STIX)在太阳能轨道器上测量的图像的重建。 使用合成的STIX数据,这项研究表明,多尺度CLEAN可能代表了先前提到的两种CLEAN限制的可靠解决方案。 此外,本文还展示了CLEAN的表现及其多尺度释放在重建以复杂排放形态为特征的实验真实情景中的表现。
在H-α观测中精确分割太阳细丝对于确定丝状手性至关重要,这是日冕物质抛射(CMEs)行为的关键因素。 然而,由于对远程依赖和空间细节进行建模的能力有限,现有方法通常无法捕获细尺度的细丝结构,特别是倒钩。 我们提出了EdgeAttNet,这是一种建立在U-Net主干基础上的分割架构,通过引入直接从输入图像中导出的新颖,可学习的边缘图。 该边缘图通过线性转换关注键和查询矩阵与边缘信息被纳入模型,从而指导网络瓶颈处的自我注意机制,以更有效地捕获灯丝边界和倒钩。 通过将这种结构先于注意力计算明确地集成到注意力计算中,EdgeAttNet增强了空间灵敏度和分割精度,同时减少了可训练参数的数量。 经过端到端的培训,EdgeAttNet在MAGFILO数据集上优于U-Net和其他基于U-Net的变压器基线。 它实现了更高的分割精度和显著更好的灯丝倒钩识别,具有更快的推理性能,适合实际部署。
继续滚动加载更多