天体物理学
Astrophysics
星系天体物理学
Astrophysics of Galaxies
宇宙学与星系外天体物理学
Cosmology and Nongalactic Astrophysics
地球与行星天体物理学
Earth and Planetary Astrophysics
将星系的形成和演化与大规模结构联系起来对于解释宇宙学观测至关重要。 虽然流体力学模拟准确地模拟了星系的相关性,但它们在计算上是令人望而却步的,无法超过与现代调查相匹配的体积。 我们通过开发一个框架来解决这个问题,以快速生成以廉价的暗物质模拟为条件的模拟星系目录。 我们提出了一个多模态,基于变压器的模型,该模型将3D暗物质密度和速度场作为输入,并输出具有物理特性的相应点星系云。 我们证明,我们经过训练的模型忠实地再现了各种星系汇总统计数据,并随着底层宇宙学和天体物理参数的变化正确捕获它们的变异,使其成为第一个加速向前模型,以捕获所有相关星系属性,它们的全部空间分布及其在水力模拟中的条件依赖性。
数据驱动的天体物理学目前依赖于对物体属性之间相关性的检测和表征,然后用于测试对它们进行预测的物理理论。 这个过程未能利用数据中构成理论预测关键部分的信息,即哪些变量是直接相关的(而不是通过其他变量意外相关),这些确定的方向,以及存在或不与数据集中相关的变量,但本身没有。 我们建议通过因果发现来恢复这些信息,这是一种开发用于推断数据集因果结构的方法,然而,天体物理学几乎完全不知道。 我们开发了一种适合大型天体物理数据集的因果发现算法,并在美国宇航局斯隆阿特拉斯系统的∼5×10^5低红移星系上将其说明,展示了其仅根据相关性区分退化的物理机制的能力。
即将测量的动力学Sunyaev-Zel'dovich(kSZ)效应,由宇宙微波背景(CMB)光子散射移动电子,为电离大纪元(EoR)提供了强大的再电离大纪元(EoR)的探测器。 kSZ 信号包含有关 EoR 的时间、持续时间和空间结构的关键信息。 精确测量CMB光学深度τ,这是表征宇宙集成电子密度的关键参数,将显着限制早期结构形成的模型。 然而,由于天体物理前景受到重大污染,弱 kSZ 信号很难从CMB观测中提取。 我们介绍了一种机器学习方法,从模拟 kSZ 地图中提取τ。 我们训练先进的机器学习模型,包括swin变压器,对kSZ信号进行高分辨率的半数值模拟。 为了有力地量化τ的预测不确定性,我们使用Laplace近似(LA)。 这种方法为模型权重的后验提供了高效且有原则的高斯近似值,从而实现了可靠的误差估计。 我们调查和比较了两种不同的应用模式:应用于预训练模型的后复合LA,以及在线LA,其中模型权重和超参数通过最大化边际可能性共同优化。 这种方法为严格限制τ及其相关的不确定性提供了一个框架,可以增强对即将到来的CMB调查的分析,如西蒙斯天文台和CMB-S4。
基于分数的模型可以作为科学逆问题的表现力,数据驱动的先验。 在强引力透镜中,它们从其扭曲的、成倍图像的观测中,使背景星系的后验。 然而,以前的工作假设镜头质量分布(因此向前运算符)是已知的。 我们通过共同推断源和参数化镜头质量剖面来放松这一假设,使用基于GibbsDDRM的采样器,但在连续时间运行。 由此产生的重建产生与观测噪声一致的残余,镜头参数的边际后验器在没有系统偏差的情况下恢复真实值。 据我们所知,这是首次成功展示基于分数的基于分数的合并源和透镜推断。
使用深度学习的数据驱动方法正在成为从宇宙学大规模结构中提取非高斯信息的强大技术。 这项工作提出了第一个基于模拟的推理(SBI)管道,将弱透镜和星系聚类地图结合在逼真的暗能量调查第3年(DES Y3)配置中,并作为即将对调查数据进行分析的准备。 我们开发了一个基于CosmoGridV1 N-body模拟套件的可扩展的前进模型,在地图级别上生成超过一百万个自静模拟实现DES Y3。 利用这个大型数据集,我们在球形几何学的完整调查足迹上训练深度图卷积神经网络,以学习低维特征,这些特征与目标参数近似地最大化相互信息。 这些学习压缩使神经密度估计通过十维参数空间中的细化流来估计隐性可能性,这些参数空间跨越宇宙学wCDM,内在对齐和线性星系偏置参数,同时边缘化于重音,光度红移和剪切偏倚。 为了确保稳健性,我们使用来自我们前进模型中的系统污染和独立的Buzzard星系目录中的合成观测来广泛验证我们的推理管道。 我们的预测在宇宙学参数约束方面产生了显着的改进,相对于我们实施基线两点统计,并通过探针组合有效地打破参数退化,在平面上实现了2-3×更高的优点。 Ω_m - S_8 这些结果证明了SBI分析的潜力,为即将到来的Stage-IV宽场成像调查提供了深度学习。
脉冲星定时阵列为测量低频引力波提供了强大的框架,但结果的准确性和稳健性受到必须准确建模的复杂噪声过程的挑战。 标准PTA分析为每个脉冲星分配固定均匀的噪声,这种方法可以在组合阵列时引入系统偏差。 为了克服这一限制,我们采用了分层的贝叶斯建模策略,其中噪声先验被更高级别超参数参数参数化。 我们进一步解决了超参数和物理噪声参数之间相关性带来的挑战,重点关注那些描述红色噪声和色散测量变化。 为了装饰这些数量,我们引入了使用 Normalizing Flows 实现的分层模型的正交再参数化。 我们还使用i-nessai,一个流导嵌套采样器,有效地探索由此产生的更高维度的参数空间。 我们将我们的方法应用于最小的3脉冲星案例研究,同时对噪声和SGWB参数进行推理。 尽管数据集有限,但结果一致表明,分层处理更严格地限制了噪声参数,并部分缓解了红噪声-SGWB的退化,而正交再参数化进一步增强了参数独立性,而不影响所涉及的物理过程的功率法建模所固有的相关性。
我们详细介绍了贝叶斯脉冲星定时阵列数据的推理工作流程,重点是通过使用基于流的嵌套采样规范化来提高效率,稳健性和速度。 在 Enterprise 框架的基础上,我们集成了 i-nessai 采样器,并将其性能用于逼真的模拟数据集。 我们分析其计算扩展和稳定性,并表明它实现了准确的后验和可靠的证据估计,并大大减少了运行时,根据数据集配置,相对于传统的单核并行脾温MCMCM分析,最多三个数量级。 这些结果突出了基于流量的嵌套采样在保持推理质量的同时加速PTA分析的潜力。
宇宙学场级推理需要可微分的前进模型,这些模型可以解决流体动力学和重力下气体和暗物质的挑战性动力学。 我们提出了一种混合方法,其中引力使用可微分的粒子网格求解器计算,而流体力学则通过将局部量映射到有效压力场的神经网络进行参数化。 我们证明,我们的方法改进了替代方法,如Enthalpy Gradient Descent基线,无论是在现场还是汇总统计水平。 该方法还具有很高的数据效率,对宇宙结构形成的单一参考模拟足以限制神经压力模型。 这为未来的应用打开了大门,其中模型直接适合观测数据,而不是一组模拟训练。
广角尾(WAT)和窄角尾(NAT)无线电活动星系核(RAGN)是星系团和星团中密集环境的关键示踪剂,但没有使用未标记的数据和纯粹视觉检查的标签对弯曲RAGN的机器学习分类器进行训练。 我们发布了RGC Python包,其中包括两个新预处理的639个WAT和NAT的标记数据集,这些数据集来自公开可用的视觉检查源目录,以及一个半监督的RGC模型,该模型利用20,000个未标记的RAGN。 RGC中标记的两个数据集使用PyBDSF进行预处理,PyBDSF保留了虚假的源,以及删除它们的Phutils。 RGC模型将自监督框架BYOL(Bootstrap YOur Latent)与监督的E2CNN(E2等效卷积神经网络)集成在一起,形成一个半监督的二进制分类器。 RGC模型在没有虚假来源的数据集上进行训练和评估时,达到峰值性能,达到88.88%的精度,WAT的F1分数为0.90,NAT为0.85。 该模型在类不平衡中的注意力模式表明,这项工作可以作为开发物理知识基础模型的垫脚石,能够识别广泛的 AGN 物理特性。
我们通过考虑所谓的约束最小超对称标准模型(CMSSM),证明了符号回归(SR)对探测粒子物理学模型(BSM)的功效。 像BSM物理学的许多化身一样,该模型具有数(四个)任意参数,这些参数决定了实验信号,以及暗物质遗迹密度等宇宙学可观测值。 我们表明,通过使用输入参数的可观测值的符号表达式,可以大大加快对现象学的分析。 在这里,我们关注希格斯质量,寒冷的暗物质遗迹密度,以及对μ子异常磁矩的贡献。 我们发现SR可以产生非常准确的表达式。 使用它们,我们使全局拟合得出CMSSM输入参数的后概率密度,这些参数与使用传统方法执行参数的后置概率密度一致。 此外,我们展示了SR的一个主要优势,即使用可微方法而不是采样方法进行拟合的能力。 我们还比较了该方法与神经网络(NN)回归。 SR产生更全球稳健的结果,而NN需要专注于有前途的区域的数据,以便具有同等的性能。
在宇宙学中,模拟器通过提供复杂物理模型的快速和准确的预测来发挥关键作用,从而能够有效地探索高维参数空间,这些参数空间在计算上是令人望而却步的。 符号模拟器已成为数字方法的有希望的替代品,提供可比的准确性与显着更快的评估时间。 虽然以前的符号模拟器仅限于相对狭窄的先前范围,但我们扩展这些范围以覆盖与当前宇宙学分析相关的参数空间。 我们介绍了用于ΛCDM共移动距离和线性生长因子的超几何函数的近似值,这些函数对于所有红移和Ω_ m∈ [0.1,0.5]的准确率分别优于0.001%和0.05%。 我们表明,将符号模拟器集成到类似暗能量勘测的3×2pt分析中会产生与使用标准数值方法获得的宇宙学约束。 我们的符号模拟器在速度和内存使用方面提供了实质性的改进,展示了其可扩展的、基于可能性的推理的实际潜力。
机器学习可以实现强大的宇宙学推理,但通常需要许多高保真模拟,涵盖许多宇宙学模型。 迁移学习提供了一种通过跨模型重用知识来降低模拟成本的方法。 我们展示了对宇宙学,ΛCDM和各种超越ΛCDM场景(包括海量中微子,修饰重力和原始非高斯性)的标准模型的预训练,可以通过显着更少的超越ΛCDM模拟实现推理。 然而,我们也表明,当ΛCDM和超越-ΛCDM参数之间存在强物理退化时,可能会发生负转移。 我们考虑各种传输架构,发现包括瓶颈结构提供最佳性能。 我们的发现说明了物理学基础模型方法的机会和陷阱:预训练可以加速推理,但也可能阻碍学习新的物理学。
深度学习已经成为现代宇宙学的变革方法,提供了强大的工具,从复杂的天文数据集中提取有意义的物理信息。 本文实现了一个新的贝叶斯图深度学习框架,用于直接从模拟宇宙微波背景(CMB)地图中估计原始磁场(PMF)宇宙学中的关键宇宙学参数。 我们的方法利用DeepSphere,这是一种球形卷积神经网络架构,专门用于通过HEALPix像素化来尊重CMB数据的球形几何。 为了超越确定性点估计并实现强大的不确定性量化,我们将贝叶斯神经网络(BNN)集成到框架中,捕获反映模型对其预测的信心的可评价性和认识论不确定性。 拟议的方法表现出卓越的性能,在磁参数估计方面达到R^2得分超过0.89。 我们通过后期训练技术(包括Variance Scaling和GPNormal)进一步获得经过良好校准的不确定性估计。 这个集成的 DeepSphere-BNNs 框架不仅提供了具有 PMF 贡献的 CMB 地图的精确参数估计,而且还提供了可靠的不确定性量化,为精密宇宙学时代的稳健宇宙学推理提供了必要的工具。
深度学习在天文学领域引发了多样化的观点,支持者与怀疑者之间的持续讨论推动了本综述的撰写。我们考察了神经网络如何补充经典统计学,扩展了现代巡天观测的数据分析工具集。天文学通过将物理对称性、守恒定律和微分方程直接编码到架构中提供了独特机遇,创建了能够泛化到训练数据之外的模型。然而挑战依然存在,未标记的观测数据达数十亿之多,而已知属性的确认样本仍然稀缺且昂贵。本综述展示了深度学习如何通过架构设计融入领域知识,内置的假设引导模型趋向物理意义明确的解。我们评估了这些方法在哪些方面提供了真正的进步,以及哪些主张需要仔细审视。- 神经架构通过将物理对称性和守恒定律编码到网络结构中,克服了可扩展性、表达能力和数据效率之间的权衡,使得从有限标记数据中学习成为可能。- 基于模拟的推断和异常检测从复杂、非高斯分布中提取信息,在这些情况下解析似然函数失效,实现了场级宇宙学分析和罕见现象的系统性发现。- 多尺度神经建模弥合了天文模拟中的分辨率差距,从昂贵的高保真度运行中学习有效的亚网格物理,以增强大体积计算,而直接计算仍然不可行。- 新兴范式——用于望远镜操作的强化学习、从少量样本中学习的基础模型,以及用于研究自动化的大语言模型智能体——尽管在天文应用中仍处于发展阶段,但展现出良好前景。
我们构建了一个神经网络,以便在局部暗物质密度场上执行回归,给定暗物质晕的特殊速度,暗物质场的偏斜示器。 我们的架构将卷积式 U-Net 与点云 DeepSets 相结合。 这种组合能够有效地利用小规模信息,提高相对于U-Net方法的重建质量。 具体来说,我们的混合网络在小尺度上比U-Net更好地恢复聚类振幅和相位。
自然科学的一个共同挑战是从观测中分离出不同的、未知的来源。 这种源分离任务的例子包括在拥挤场中分解星系,将单个神经元的活动与重叠的信号区分开来,并将地震事件与环境背景分开。 传统的分析通常依赖于无法准确再现数据的简化源模型。 最近的进步表明,扩散模型可以直接从嘈杂、不完整的数据中学习复杂的先验分布。 在这项工作中,我们表明扩散模型可以解决源分离问题,而无需对源进行明确的假设。 我们的方法仅依赖于多个视图,或者不同观测集包含未知源的不同线性变换的属性。 我们表明,即使没有单独观察到来源,并且观测结果嘈杂,不完整,分辨率也不同,我们的方法也会成功。 学到的扩散模型使我们能够从源先验中采样,评估候选源的概率,并从给定的源分布的联合后验中提取。 我们展示了我们的方法在一系列合成问题以及现实世界的星系观测方面的有效性。
解决宇宙学中最基本的问题需要与下一代天空调查所要求的规模、保真度和物理复杂性相匹配的模拟。 为了实现这种关键科学伙伴关系所需的现实主义,详细的气体动力学以及一系列天体物理效应必须与重力进行自我一致的处理,以便对结构形成进行端到端建模。 作为该路线图的重要一步,exascale计算使模拟能够跨越调查规模,同时整合塑造复杂宇宙结构的关键子网格过程。 我们介绍了CRK-HACC的结果,CRK-HACC是一个宇宙学流体力学代码,专为现代宇宙学调查设定的极端可扩展性要求而构建。 使用隔离技术,GPU驻留树求解器,原位分析管道和多层I / O,CRK-HACC执行Frontier-E:一个四万亿粒子全天空模拟,比以前的努力大一个数量级。 该运行实现了53.1 PFLOPs的峰值性能,每秒处理466亿个粒子,并在超过一周的运行时写入超过100PB的数据。
我们研究了物理信息神经网络的一种新变体来预测最近超新星和重子声震荡(BAO)数据集的宇宙学参数。 我们的机器学习框架生成目标变量的不确定性估计值以及底层PDE描述的推断未知参数。 基于Evidential Deep Learning,Physical-Informed Neural Networks,Bayesian Neural Networks和Gaussian Processes原理的混合体,我们的模型通过基于梯度下降的标准训练,可以学习未知PDE参数的后验分布。 我们将模型应用于最新的BAO数据集(Bousis等人。 2024年:CMB推断的声音视界和Pantheon+Sne Ia距离(Scolnic等)校准。 2018年),研究标准 ΛCDM, wCDM 和 Λ_sCDM 模型之间的相对有效性和相互一致性。 与以前最小化适当 χ^2 函数的标准方法产生的结果不同,发现纯粹在Pantheon+数据上训练的各种模型中参数的后验分布主要包含在对BAO数据训练的对应物的轮廓中。 他们 h_0 的后位中位数大约在 2σ 彼此之间,这表明我们的机器学习引导方法提供了不同的哈勃张力测量。
氢是我们宇宙中最丰富的元素。 第一代恒星和星系产生了电离氢气的光子,推动了一种称为电离大纪元(EoR)的宇宙学事件。 即将推出的平方公里阵列天文台(SKAO)将绘制这个时代中性氢的分布图,有助于研究这些第一代物体的特性。 提取天体物理信息将具有挑战性,因为SKAO将产生大量数据,其中氢信号将被不受欢迎的前景污染和仪器系统污染。 为了解决这个问题,我们开发了最新的深度学习技术,从SKAO预期的氢信号的2D功率光谱中提取信息。 我们将一系列神经网络模型应用于这些测量,并量化它们预测宇宙氢再电离历史的能力,这与早期光子源的数量和效率不断增加有关。 我们表明,早期宇宙的研究受益于现代深度学习技术。 特别是,我们证明专用机器学习算法在恢复再电化历史时平均可以达到0.95 R^2以上的分数。 这可以实现对早期宇宙中结构形成的准确和精确的宇宙学和天体物理推断。
我们介绍了一种从训练集捕获高信息后验器的方法,这些训练集在参数空间上采样稀疏,以实现基于模拟的稳健推理。 在物理推理问题中,我们通常可以应用域知识来定义传统的汇总统计,以捕获数据集中的一些信息。 我们表明,通过神经网络输出来增强这些统计数据,以最大限度地提高相互信息,与神经摘要单独或它们与现有摘要的连接相比,可以改进信息提取,并使推理在具有低训练数据的设置中具有稳健性。 我们介绍了1)实现这一点的两个损失形式主义,2)将该技术应用于两个不同的宇宙学数据集,以提取非高斯参数信息。
继续滚动加载更多