大气与海洋物理学研究快报
用 AI 跟踪日新月异的大气与海洋物理学领域进展

从云粒子图像中预测冰晶微观物理特性的机器学习框架
冰晶的微观物理特性很重要,因为它们显着改变了云的辐射特性和时空分布,进而强烈影响地球的气候。 然而,测量冰晶的关键特性具有挑战性,例如质量或形态特征。 在这里,我们提出了一个框架,用于从原位二维(2D)图像中预测冰晶的三维(3D)微观物理特性。 首先,我们使用3D建模软件计算生成合成冰晶,以及2021年冰轮球(ICEBall)现场活动估计的几何参数。 然后,我们使用合成晶体来训练机器学习(ML)模型,以预测来自合成玫瑰图像的有效密度(ρ_e),有效的表面积(A_e)和子弹数(N_b)。 当在看不见的合成图像上进行测试时,我们发现我们的ML模型可以高精度地预测微观物理特性。 对于ρ_e和A_e,我们表现最佳的单视图模型分别实现了0.99和0.98的R^2值。 对于N_b,我们最好的单视图模型实现了平衡精度和F1得分0.91。 我们还量化了纳入第二个视图的边际预测改进。 立体视图 ResNet-18 型号将 RMSE 减少了 40

发现Sargassum木筏的质量中心的动态
自2011年以来,漂浮的沙加苏姆海藻的木筏经常阻碍美洲内部海域的海岸。 筏子的运动是由高维非线性动力学系统表示的。 被称为eBOMB模型,它建立在Maxey-Riley方程的基础上,将形成木筏的沙加苏姆团与地球自转的影响之间的相互作用结合起来。 缺乏对木筏质量中心的预测法表明需要机器学习。 在本文中,我们评估和对比了长短期记忆(LSTM)复发神经网络(RNN)和非线性动力学的稀疏识别(SINDy)。 在这两种情况下,都采用物理启发的闭包建模方法,根植于eBOMB。 具体来说,LSTM模型从eBOMB变量集合中学习到木筏中心和海洋速度之间的差异的映射。 SINDy模型的候选函数库由eBOMB变量建议,并包含包含承载流的远场效应的窗口速度术语。 LSTM和SINDy模型在紧密粘合团块的条件下表现最有效,尽管精度下降,复杂性上升,例如风效应和评估松散连接的团块。 LSTM模型在设计简单时提供了最佳效果,神经元和隐藏层更少。 虽然LSTM模型是一个不透明的黑盒模型,缺乏可解释性,但SINDy模型通过函数库识别明确的功能关系来带来透明度。 窗口速度项的集成使非本地交互的有效建模成为可能,特别是在具有稀疏连接木筏的数据集中。

基于CNN的表面温度预测,在中程预测期内进行数值天气预报
这项研究提出了一种方法,将卷积神经网络(CNN)与集成数值天气预报(NWP)模型集成在一起,使表面温度预测在短程(五天)预测期以外的时间。 由于计算资源有限,操作中程温度预测通常依赖于低分辨率的NWP模型,这些模型容易出现系统和随机错误。 为了解决这些限制,建议的方法首先通过基于CNN的后处理(偏差校正和空间超分辨率)在每个集成成员上减少系统错误,从低分辨率模型输出中重建高分辨率温度场。 其次,它通过 CNN 校正的成员的集合平均来减少随机错误。 这项研究还调查了 CNN 校正和整体平均的序列是否影响了预测的准确性。 为了与拟议的方法进行比较,我们还进行了 CNN 实验,对集合平均预测进行了训练。 首行方法——在集成平均之前进行 CNN 校正——持续地实现了比反向方法更高的精度。 虽然基于低分辨率的集成预测,但拟议的方法明显优于高分辨率确定性NWP模型。 这些发现表明,将基于CNN的校正与集成平均相结合有效地减少了NWP模型输出中的系统和随机错误。 拟议的方法是用于改进中程温度预测的实用且可扩展的解决方案,在计算资源有限的运营中心尤其有价值。

EarthLink:气候科学的自主AI代理
现代地球科学正处于拐点。 地球系统数据的巨大、分散和复杂,加上日益复杂的分析需求,为快速科学发现创造了重大瓶颈。 在这里,我们介绍了EarthLink,这是第一个为地球科学家设计的互动副驾驶的AI代理。 它自动化了端到端的研究工作流程,从规划和代码生成到多场景分析。 与静态诊断工具不同,EarthLink可以从用户交互中学习,通过动态反馈循环不断完善其功能。 我们在气候变化的一些核心科学任务上验证了它的性能,从模型观测比较到复杂现象的诊断。 在多专家评估中,EarthLink进行了科学合理的分析,并展示了一种分析能力,该能力被评为与人类初级研究员工作流程的特定方面相当。 此外,其透明,可审计的工作流程和自然语言界面使科学家能够从艰苦的手动执行转向战略监督和假设生成。 EarthLink标志着在加速全球变革的时代,朝着高效,可信和协作的地球系统研究范式迈出了关键一步。 该系统可在我们的网站https://earthlink.intern-ai.org.cn访问。

贝叶斯深度学习用于对流初生临近预报不确定性估计
本研究评估了五种最近提出的贝叶斯深度学习方法相对于确定性残差神经网络(ResNet)基线在0-1小时对流初生(CI)临近预报中使用GOES-16卫星红外观测的概率和不确定性预测。不确定性通过概率预测的校准程度以及不确定性如何区分误差大和误差小的预测来评估。大多数贝叶斯深度学习方法产生的概率预测优于确定性ResNet,其中一种方法,初始权重集合+蒙特卡洛(MC)dropout,即在推理过程中激活dropout并使用不同初始权重开始训练的确定性ResNets集合,产生了最有技巧和校准最好的预测。初始权重集合+MC dropout通过生成多个解决方案更全面地采样假设空间而受益。贝叶斯ResNet集合是唯一一个在较长预见期表现比确定性ResNet差的方法,可能是由于优化更多参数的挑战。为了解决这个问题,采用了贝叶斯-MOPED(使用深度神经网络的基于经验贝叶斯的模型先验)ResNet集合,它通过将假设搜索限制在确定性ResNet假设附近来增强预测技巧。所有贝叶斯方法都展示了良好的校准不确定性和有效区分误差大和误差小的案例。在案例研究中,初始权重集合+MC dropout在晴空区域选定的CI事件上展示了比贝叶斯-MOPED集合和确定性ResNet更好的预测技巧。然而,与确定性ResNet和贝叶斯-MOPED集合相比,初始权重集合+MC dropout在没有CI发生的晴空和砧状云区域表现出较差的泛化能力。
相关分类
最新研究
从云粒子图像中预测冰晶微观物理特性的机器学习框架
冰晶的微观物理特性很重要,因为它们显着改变了云的辐射特性和时空分布,进而强烈影响地球的气候。 然而,测量冰晶的关键特性具有挑战性,例如质量或形态特征。 在这里,我们提出了一个框架,用于从原位二维(2D)图像中预测冰晶的三维(3D)微观物理特性。 首先,我们使用3D建模软件计算生成合成冰晶,以及2021年冰轮球(ICEBall)现场活动估计的几何参数。 然后,我们使用合成晶体来训练机器学习(ML)模型,以预测来自合成玫瑰图像的有效密度(ρ_e),有效的表面积(A_e)和子弹数(N_b)。 当在看不见的合成图像上进行测试时,我们发现我们的ML模型可以高精度地预测微观物理特性。 对于ρ_e和A_e,我们表现最佳的单视图模型分别实现了0.99和0.98的R^2值。 对于N_b,我们最好的单视图模型实现了平衡精度和F1得分0.91。 我们还量化了纳入第二个视图的边际预测改进。 立体视图 ResNet-18 型号将 RMSE 减少了 40
发现Sargassum木筏的质量中心的动态
自2011年以来,漂浮的沙加苏姆海藻的木筏经常阻碍美洲内部海域的海岸。 筏子的运动是由高维非线性动力学系统表示的。 被称为eBOMB模型,它建立在Maxey-Riley方程的基础上,将形成木筏的沙加苏姆团与地球自转的影响之间的相互作用结合起来。 缺乏对木筏质量中心的预测法表明需要机器学习。 在本文中,我们评估和对比了长短期记忆(LSTM)复发神经网络(RNN)和非线性动力学的稀疏识别(SINDy)。 在这两种情况下,都采用物理启发的闭包建模方法,根植于eBOMB。 具体来说,LSTM模型从eBOMB变量集合中学习到木筏中心和海洋速度之间的差异的映射。 SINDy模型的候选函数库由eBOMB变量建议,并包含包含承载流的远场效应的窗口速度术语。 LSTM和SINDy模型在紧密粘合团块的条件下表现最有效,尽管精度下降,复杂性上升,例如风效应和评估松散连接的团块。 LSTM模型在设计简单时提供了最佳效果,神经元和隐藏层更少。 虽然LSTM模型是一个不透明的黑盒模型,缺乏可解释性,但SINDy模型通过函数库识别明确的功能关系来带来透明度。 窗口速度项的集成使非本地交互的有效建模成为可能,特别是在具有稀疏连接木筏的数据集中。
基于CNN的表面温度预测,在中程预测期内进行数值天气预报
这项研究提出了一种方法,将卷积神经网络(CNN)与集成数值天气预报(NWP)模型集成在一起,使表面温度预测在短程(五天)预测期以外的时间。 由于计算资源有限,操作中程温度预测通常依赖于低分辨率的NWP模型,这些模型容易出现系统和随机错误。 为了解决这些限制,建议的方法首先通过基于CNN的后处理(偏差校正和空间超分辨率)在每个集成成员上减少系统错误,从低分辨率模型输出中重建高分辨率温度场。 其次,它通过 CNN 校正的成员的集合平均来减少随机错误。 这项研究还调查了 CNN 校正和整体平均的序列是否影响了预测的准确性。 为了与拟议的方法进行比较,我们还进行了 CNN 实验,对集合平均预测进行了训练。 首行方法——在集成平均之前进行 CNN 校正——持续地实现了比反向方法更高的精度。 虽然基于低分辨率的集成预测,但拟议的方法明显优于高分辨率确定性NWP模型。 这些发现表明,将基于CNN的校正与集成平均相结合有效地减少了NWP模型输出中的系统和随机错误。 拟议的方法是用于改进中程温度预测的实用且可扩展的解决方案,在计算资源有限的运营中心尤其有价值。
EarthLink:气候科学的自主AI代理
现代地球科学正处于拐点。 地球系统数据的巨大、分散和复杂,加上日益复杂的分析需求,为快速科学发现创造了重大瓶颈。 在这里,我们介绍了EarthLink,这是第一个为地球科学家设计的互动副驾驶的AI代理。 它自动化了端到端的研究工作流程,从规划和代码生成到多场景分析。 与静态诊断工具不同,EarthLink可以从用户交互中学习,通过动态反馈循环不断完善其功能。 我们在气候变化的一些核心科学任务上验证了它的性能,从模型观测比较到复杂现象的诊断。 在多专家评估中,EarthLink进行了科学合理的分析,并展示了一种分析能力,该能力被评为与人类初级研究员工作流程的特定方面相当。 此外,其透明,可审计的工作流程和自然语言界面使科学家能够从艰苦的手动执行转向战略监督和假设生成。 EarthLink标志着在加速全球变革的时代,朝着高效,可信和协作的地球系统研究范式迈出了关键一步。 该系统可在我们的网站https://earthlink.intern-ai.org.cn访问。
数据驱动的区域天气预报的拉伸网格和有限区域建模的比较
基于图神经网络的区域机器学习天气预报(MLWP)模型最近显示出显着的预测准确性,以较低的计算成本优于数值天气预报模型。 特别是,根据区域(再)分析的初步条件,出现了用于生成高分辨率区域预测的有限区域模型(LAM)和拉伸网格模型(SGM)方法。 虽然LAM使用外部全局模型的横向边界,但SGM以较低的分辨率集成了全局域。 这项研究旨在了解模型设计的差异如何影响相对性能和潜在应用。 具体而言,确定了这两种方法的优势和劣势,以产生对欧洲的决定主义区域预测。 使用Anemoi框架,这两种模型都是通过最小化调整共享架构并在几乎相同的设置中使用全球和区域再分析来构建的。 已经进行了几次推理实验,以探索它们的相对性能并突出关键差异。 结果表明,LAM和SGM都是具有竞争性的确定性MLWP模型,在区域领域具有普遍准确和可比的预测性能。 模型在跨应用的性能上发现了各种差异。 LAM能够成功地利用高质量的边界强制在区域领域内进行预测,并且适用于难以获取全球数据的情况。 SGM是完全独立的,便于操作,可以利用更多的训练数据,并在(时间)可推广性方面大大超过LAM。 我们的论文可以作为气象机构指导他们在开发运营数据驱动预测系统时选择LAM和SGM的起点。
跨球式多尺度深度学习预测ENSO在2年后
厄尔尼诺-南方涛动(ENSO)对全球气候和社会产生影响,但超过一年的实时预测仍然具有挑战性。 动态模型受到很大的偏见和不确定性的影响,而深度学习则与可解释性和多尺度动力学作斗争。 在这里,我们介绍了PTSTnet,一个可解释的模型,将动态过程和跨尺度时空学习统一在一个创新的神经网络框架中,具有物理编码学习。 PTSTnet产生的可解释性预测显著优于最先进的基准,交货时间超过24个月,为海洋大气相互作用中的错误传播提供了物理见解。 PTSTnet从稀疏数据中学习具有物理一致性的特征表示,以解决海洋-大气过程背后的固有多尺度和多物理挑战,从而固有地增强长期预测技能。 我们的成功实现标志着在创新神经海洋建模的可解释性见解方面迈出了实质性的一步。
在课堂和研究中使用生成式人工智能:示例和经验教训
虽然生成式人工智能(AI)并不新鲜,但最近的技术突破已经改变了其在许多领域的能力。 这些变化需要教育工作者和大气及相关科学领域的专门培训给予新的关注。 使学生能够有效,负责任和道德地使用生成式AI,对于他们的学术和专业发展至关重要。 教育工作者还可以使用生成式AI来开发引人入胜的课堂活动,例如主动学习模块和游戏;然而,他们必须意识到潜在的陷阱和偏见。 在使用缺乏透明度和具有相当碳足迹的工具时也存在道德影响,以及缺乏更复杂付费版本的生成式AI工具的学生的公平问题,并且在以前的教育培训中存在缺陷。 本文是写给学生和教育工作者的,特别是那些有兴趣在教育和研究中更多地了解生成式AI的人,包括其用例,伦理问题以及其出现的简要历史。 在教育、大气和相关科学的许多应用中也提供了示例用户提示。 目前解决有关在教育中使用生成式人工智能的更广泛的伦理问题的解决方案仍然有限;然而,这项工作旨在促进一场讨论,以激励教育界围绕共同目标和价值观。
基于GOES-16卫星观测的物理可解释深度学习在对流初生临近预报中的应用
对流初生(CI)临近预报对于数值天气预报模型和现有临近预报算法来说仍然是一个具有挑战性的问题。本研究开发了基于对象的概率深度学习模型,利用多通道红外GOES-R卫星观测数据来预测CI。数据来自2020年6月和7月以及2021年6月大平原地区Multi-Radar Multi-Sensor多普勒天气雷达产品中识别的潜在CI事件周围的区域。采用基于雷达的客观方法来识别这些事件。深度学习模型在提前1小时的预报中显著优于传统逻辑模型,尤其是在误报率方面。通过案例研究,深度学习模型展示了其对多层次云和湿度特征的依赖性。模型解释进一步揭示了模型在不同基线下的决策过程。解释结果强调了根据基线选择不同层次湿度和云特征的重要性。我们的研究证明了使用不同基线在进一步理解模型行为和获得科学见解方面的优势。
贝叶斯深度学习用于对流初生临近预报不确定性估计
本研究评估了五种最近提出的贝叶斯深度学习方法相对于确定性残差神经网络(ResNet)基线在0-1小时对流初生(CI)临近预报中使用GOES-16卫星红外观测的概率和不确定性预测。不确定性通过概率预测的校准程度以及不确定性如何区分误差大和误差小的预测来评估。大多数贝叶斯深度学习方法产生的概率预测优于确定性ResNet,其中一种方法,初始权重集合+蒙特卡洛(MC)dropout,即在推理过程中激活dropout并使用不同初始权重开始训练的确定性ResNets集合,产生了最有技巧和校准最好的预测。初始权重集合+MC dropout通过生成多个解决方案更全面地采样假设空间而受益。贝叶斯ResNet集合是唯一一个在较长预见期表现比确定性ResNet差的方法,可能是由于优化更多参数的挑战。为了解决这个问题,采用了贝叶斯-MOPED(使用深度神经网络的基于经验贝叶斯的模型先验)ResNet集合,它通过将假设搜索限制在确定性ResNet假设附近来增强预测技巧。所有贝叶斯方法都展示了良好的校准不确定性和有效区分误差大和误差小的案例。在案例研究中,初始权重集合+MC dropout在晴空区域选定的CI事件上展示了比贝叶斯-MOPED集合和确定性ResNet更好的预测技巧。然而,与确定性ResNet和贝叶斯-MOPED集合相比,初始权重集合+MC dropout在没有CI发生的晴空和砧状云区域表现出较差的泛化能力。
可扩展的气候数据分析:平衡Petascale富达和计算成本
来自遥感和模拟的气候数据不断增长的分辨率和体积带来了重大的存储、处理和计算挑战。 传统的压缩或子采样方法通常会损害数据保真度,从而限制科学见解。 我们引入了一个可扩展的生态系统,集成了分层多分辨率数据管理、智能传输和 ML 辅助重建,以平衡准确性和效率。 我们的方法将存储和计算成本降低了99%,将费用从100,000美元降至24美元,同时保持根均方(RMS)误差为1.46摄氏度。 我们的实验结果证实,即使显著减少数据,也保留了准确气候分析所需的基本特征。 该解决方案在 petascale NASA 气候数据集上进行了验证,可实现具有成本效益、高保真度的气候分析,用于研究和决策。
FourCastNet 3:大规模概率机器学习天气预报的几何方法
FourCastNet 3通过实施可扩展的几何机器学习(ML)方法来推进全球天气建模,以实现概率集成预测。 该方法旨在尊重球形几何学,并准确模拟问题的空间相关性概率性质,从而在多个尺度上产生稳定的光谱和逼真的动力学。 FourCastNet 3提供的预测精度超过了领先的传统集成模型,并与基于扩散的最佳方法相媲美,同时产生的预测速度比这些方法快8到60倍。 与其他ML方法相反,FourCastNet 3展示了出色的概率校准,并保留了逼真的光谱,即使在长达60天的延长交货期也是如此。 所有这些进步都是使用为球形几何体量身定制的纯卷积神经网络架构实现的。 通过结合模型和数据并行的新型训练,在1024个GPU上实现可扩展和高效的大规模大规模训练,灵感来自经典数值模型中的域分解方法。 此外,FourCastNet 3可以在单个GPU上快速推理,在20秒内以0.25,6小时分辨率产生90天的全球预测。 其计算效率,中程概率技能,光谱保真度和亚季节时间尺度的推出稳定性使其成为通过大型集成预测改善气象预报和预警系统的有力候选者。
可再生能源资源数据的超级分辨率与风能从再分析数据和应用到乌克兰
随着依靠风能提供发电能力和能源的电网份额可能越来越大,全球对历史上精确、零星连续、高分辨率的风能数据的需求不断扩大。 基于数值天气预报生成这些数据的常规缩小减小方法具有很高的计算负担,并且需要对历史准确性进行广泛的调整。 在这项工作中,我们提出了一种新的基于深度学习的时空缩小扩展方法,使用生成对抗网络(GAN),从欧洲中期天气预报中心(ERA5)生成历史上准确的高分辨率风资源数据。 与以前使用粗化高分辨率数据作为低分辨率训练数据的方法相反,我们使用真正的低分辨率模拟输出。 我们通过训练以ERA5作为低分辨率输入和风集成国家数据集工具包(WTK)数据作为高分辨率目标的GAN模型,我们在历史准确性和时空可变性方面取得了与传统动力缩小规模相当的结果。 这种基于GAN的缩小减小方法还降低了两个数量级的动态缩小计算成本。 我们采用这种方法,在乌克兰,摩尔多瓦和罗马尼亚的多个枢纽高度,2000年1月至2023年12月的5分钟风速数据下调30公里,每小时ERA5数据。 这个24年的数据记录是可再生能源资源数据超级分辨率的第一个成员,来自再分析数据数据集(Sup3rWind)的风。
基于CNN的天气预报模型现代化,以实现更高的计算效率
最近,基于AI的天气预报模型取得了令人印象深刻的进步。 这些模型已达到与传统NWP系统相当的准确性水平,标志着数据驱动的天气预报的一个重要里程碑。 然而,它们主要利用基于Transformer的架构,由于参数大小很大,这通常会导致高训练复杂性和资源需求。 在这项研究中,我们引入了基于CNN的现代化全球天气预报模型,该模型提供具有竞争力的准确性,同时显着降低计算需求。 为了提出系统的现代化路线图,我们强调了早期基于CNN的方法跨多个设计尺度的关键架构增强。 KAI-a将规模不变的架构和基于InceptionNeXt的块纳入地球物理感知设计,根据地球系统数据的结构量身定制。 该模型在具有67个大气变量的ERA5每日数据集上进行了训练,包含约700万个参数,并在单个NVIDIA L40s GPU上仅12小时内完成训练。 我们的评估表明,KAI-a与中程天气预报中最先进的模型的性能相匹配,同时提供显着的轻量级设计。 此外,关于2018年欧洲热浪和东亚夏季季风的案例研究证明了KAI-a在捕捉极端事件方面的强大技能,加强了其实用性。
通过非线性模型改善欧洲的亚季节性风速预测
次季节性风速预测为风电系统规划和运营提供了宝贵的指导,但表面风的预测技能在两周后急剧下降。 然而,大规模变量在这个时间尺度上表现出更大的可预测性。 这项研究探讨了利用500 hPa 地电位高度(Z500)和地表风速之间的非线性关系来提高欧洲亚季节风速预测技能的潜力。 我们提出的框架使用多线性回归(MLR)或卷积神经网络(CNN)从Z500倒退表面风速。 对ERA5再分析的评估表明,由于其非线性,CNN的表现更好。 将这些模型应用于欧洲中期天气预报中心的次季节性预测,各种验证指标证明了非线性的优势。 然而,这在一定程度上是由于这些统计模型的分散性不足,因为它们只解释了目标变量方差的一小部分。 引入随机扰动来表示信号中无法解释的部分的随机性有助于弥补这个问题。 结果显示,在最初几周内,受干扰的 CNN 的表现比受干扰的 MLR 要好,而受干扰的 MLR 的表现在两个星期后就会收敛到被干扰的 CNN 。 研究发现,引入随机扰动可以解决这些统计模型中传播不足的问题,非线性的改善与预测的交货时间不同。
通过知识知情的生成建模捕捉看不见的空间极端
观测到的气候极端情况提供了不完整的风险图景,错过了超越历史界限的“看不见的”极端情况。 与此同时,忽视空间依赖低估了放大影响的同步危害的风险。 为了应对这些挑战,我们开发了DeepX-GAN(物理极限嵌入 - 生成对抗网络),这是一种知识渊博的深层生成模型,旨在更好地捕捉罕见极端的空间结构。 DeepX-GAN的零镜头可推广性能够模拟超越历史经验的看不见的极端,但在统计学上仍然是合理的。 我们定义了两种类型的看不见的极端:“checkmate”极端,直接击中目标,和“稳定”极端,勉强错过。 这些未实现的场景暴露了脆弱系统中的潜在风险,如果被忽视,可能会加强虚假的复原力。 特别是,接近失误可以促使积极主动的适应或危险的自满,这取决于它们的解释方式。 将DeepX-GAN应用于中东和北非(MENA),我们发现这些看不见的极端不成比例地影响高度脆弱性和低社会经济准备的地区,但在紧迫性和解释方面有所不同。 未来的变暖可能会扩大和重新分配这些看不见的极端,在印度 - 巴基斯坦和中非出现暴露热点。 这种分配转变凸显了传统危险规划中的关键盲点,并强调需要制定空间适应性政策,预测新出现的风险热点,而不是简单地从历史模式中推断。
XiChen:具有4D变异知识的可观测可扩展的完全AI驱动的全球天气预报系统
人工智能(AI)的最新进展显示出彻底改变天气预报的巨大潜力。 然而,大多数人工智能驱动的模型都依赖于数值天气预报(NWP)系统进行初始状态准备,这通常消耗超级计算机的时间。 在这里,我们介绍了XiChen,这是第一个可观测的完全AI驱动的全球天气预报系统,其整个管道,从数据同化(DA)到中程预测,只能在17秒内完成。 XiChen建立在预先训练天气预报的基础模型之上。 同时,该模型随后被微调为观测操作员和DA模型,从而可显著地同化常规和原始卫星观测。 此外,四维变异知识的集成确保了XiChen的DA和中程预测精度与运行中的NWP系统相媲美,惊人的实现了超过8.25天的熟练预测时间。 这些发现表明,XiChen在完全AI驱动的天气预报方面具有强大的潜力,独立于NWP系统。
调查极端降水超级解决的稳健性跨越气候
网格状气候模型(如一般环流模型)的粗糙空间分辨率限制了它们直接用于预测与社会相关的变量,如极端降水。 大多数缩小尺度的方法通过产生大型集合来估计极端的条件分布,使分布变化(如气候变化引起的变化)下对稳健性的评估复杂化。 为了更好地理解和潜在地提高鲁棒性,我们建议使用可分析的可操作映射直接解决目标变量概率分布的参数。 在瑞士上空的完美模型框架内,我们证明矢量广义线性和添加剂模型可以超级解决来自粗沉淀场和地形的夏季小时降水极端分布的广义极端值分布。 我们引入了“稳健性差距”的概念,定义为当前训练模型和未来训练模型之间的预测误差差异,并用它来诊断模型结构如何影响每个分位数对伪全球变暖情景的概括。 通过评估多个模型配置,我们还根据降水和海拔的空间自动和交叉相关性确定了超分辨率因子的上限,超过该值的粗沉淀失去预测值。 我们的框架广泛适用于参数分布的变量,并提供与模型无关的诊断,用于了解何时以及为什么经验缩小会泛化到气候变化和极端。
可扩展的 ADER-DG 运输方法与多项式订单独立 CFL 限制
众所周知,随着多项式订单的增加,不连续的Galerkin(DG)方法受到越来越严格的时间步骤限制,限制了高订单的效率。 在本文中,我们介绍了一种新颖的本地隐含但全球明确的ADER-DG计划,旨在解决运输主导的问题。 该方法实现了由基于元素的CFL条件控制的最大稳定时间步骤,该条件独立于多项式程度。 通过在每个时间步骤中解决一组元素局部隐性问题,我们的方法更有效地捕获了依赖的领域。 因此,我们的方法在 d 空间维度中 CFL 数保持稳定,最高可达 1/√(d)。 我们在一个维度上提供严格的稳定性证明,并使用半分析冯·诺依曼稳定性分析将分析扩展到二维和三维。 该方法的准确性和收敛性通过线性和非线性测试案例的数值实验进行演示。
拓扑数据分析(TDA)入门指南:支持环境科学中的图像分析任务
拓扑数据分析(TDA)是数据科学和数学领域的一种工具,正开始在环境科学领域产生影响。在这项工作中,我们试图对TDA中一个特别适用于图像分析的工具——persistent homology——提供一个直观易懂的介绍。我们简要讨论了理论背景,但主要侧重于理解该工具的输出并讨论它能获取哪些信息。为此,我们围绕一个指导性案例展开讨论,该案例使用Rasp等人2020年为研究中尺度云组织而创建的Sugar、Fish、Flower和Gravel数据集(arXiv:1906:01906)中的卫星图像分类。我们展示了persistent homology及其向量化形式persistence landscapes如何与简单的机器学习算法结合使用以获得良好结果,并详细探讨了如何从图像层面特征解释这种行为。persistent homology的核心优势之一是其可解释性,因此我们在本文中不仅讨论发现的模式,还解释为什么根据persistent homology理论可以预期这些结果。我们的目标是让读者在阅读本文后能更好地理解TDA和persistent homology,能够识别persistent homology可能有帮助的问题和数据集,并理解通过应用GitHub示例代码获得的结果。
量化Dunkelflaute现象:欧洲可变可再生能源干旱期分析
可变可再生能源干旱期(又称"Dunkelflaute")正成为基于可变可再生能源的气候中性能源系统面临的挑战。基于38个历史气象年份数据和先进的识别方法,我们刻画了欧洲陆上风电、海上风电、太阳能光伏以及可再生能源技术组合的干旱事件特征。研究表明,这些特征很大程度上取决于所选的干旱阈值,这对单阈值分析的有效性提出了质疑。通过应用多阈值框架,我们量化了风能和太阳能在时间和空间上的互补性如何缓解国家内部(组合效应)和国家间(平衡效应)的干旱频率、持续时间和严重程度。基于政策相关的脱碳情景,我们识别了最极端的干旱事件,并展示了这些事件如何驱动完全可再生能源化的欧洲能源系统中长期储能的重大放电周期。这类事件由不同严重程度的较短干旱期序列组成。在最极端的事件中,1996/97年冬季的事件在完全互联条件下持续了55天。尽管这一时期可再生能源的平均可用率仍达47%