物理学
Physics
加速器物理
Accelerator Physics
应用物理学
Applied Physics
大气与海洋物理学
Atmospheric and Oceanic Physics
钢筋混凝土轨道桥是铁路基础设施的重要组成部分,可靠性、耐用性和适应性是关键的设计重点。 然而,由于不可预见的施工限制,例如需要重新定位桥墩或改变几何特性,设计过程往往很复杂。 这些设计调整可能导致重复重新设计,增加成本和项目延迟,如果在早期设计阶段没有预期,以及使用传统有限元(FE)模拟时的重大计算开销。 为了解决这个问题并预测这些意外事件,本研究采用替代建模作为有效的概率设计方法。 该方法将关键几何参数作为随机变量集成,捕获设计和施工阶段可能出现的不确定性,并将其传播到桥梁的性能函数上。 通过这样做,我们的目标是以最小的依赖时间对耗时的有限元(FE)模拟进行大量设计场景的高效探索,将钢筋混凝土桥的性能功能作为我们可变设计参数的功能,并将整体设计场景分类为故障和安全场景 在这项研究中,使用Cast3M软件中的多光纤有限元方法建模四跨度钢筋混凝土桥面。 该FE模型用于生成所需的实验设计,以训练替代模型。 在这个框架内,进行比较性能评估,以评估Kriging替代物对替代方法的性能,包括多项式混沌扩展(在UQLab中实现)和支持向量回归(SVR)。 该方法支持早期不确定性导向设计,在面对实际限制和不断变化的场地条件时,增强钢筋混凝土轨道桥的坚固性和适应性。
聚变能量研究越来越依赖于整合来自高分辨率诊断、控制系统和多尺度模拟的异构多模态数据集的能力。 这些数据集的庞大数量和复杂性要求开发能够系统地协调和提取不同模式知识的新工具。 Data Fusion Labeler(dFL)作为一种统一的工作流程工具推出,可大规模执行具有不确定性感知数据协调,符合模式的数据融合以及丰富的出处手动和自动化标签。 通过在可重复的操作员订单感知框架中嵌入对齐、规范化和标签,dFL 将分析时间缩短了超过 50 倍(例如,使 >200 次/小时能够一致地标记,而不是每天少量),增强了标签(以及随后的训练)质量,并实现了跨设备的可比性。 来自DIII-D的案例研究证明了其应用于自动化ELM检测和约束机制分类,说明了其作为未来燃烧等离子体设备中数据驱动发现,模型验证和实时控制的核心组件的潜力。
在整个科学领域,我们发现自己减去或分割随机信号。 例如,考虑从两个随机信号a和b的加法或乘法生成的随机实现,即x=a+b或x = ab。 对于 x=a+b 示例,a 可以是荧光背景,也可以是感兴趣的信号,其统计数据可以从测量的 x 中学习。 同样,在编写x=ab时,a可以被认为是照明强度和b感兴趣的荧光分子的密度。 然而,分割或减去随机信号会放大噪声,我们反而问,使用a的统计值和x的测量作为输入,我们是否可以恢复b的统计学。 在这里,我们展示了归一化流如何生成概率分布的近似值,从而完全避免减法或划分。 此方法在我们的软件包 NFdeconvolve 中实现,可在 GitHub 上获得,并在主文本中链接教程。
组织模型是固体力学和材料科学的基础,支持在不同负载条件下对材料响应的定量描述和预测。 传统的现象学模型是通过经验拟合得出的,它们往往缺乏可推广性,严重依赖专家直觉和预先定义的功能形式。 在这项工作中,我们提出了一个基于图形的方程发现框架,用于直接从多源实验数据自动发现构成定律。 这个框架将方程表示为定向图,其中节点表示运算符和变量,边缘表示计算关系,边缘特征编码参数依赖关系。 这可以实现使用未确定的材料特定参数的自由形式符号表达式的生成和优化。 通过拟议的框架,我们发现了合金钢材料应变率效应和锂金属变形行为的新构成模型。 与传统的实证模型相比,这些新模型表现出紧凑的分析结构,并达到更高的精度。 拟议的基于图的方程发现框架为数据驱动的科学建模提供了一种可推广和可解释的方法,特别是在传统经验公式不足以代表复杂物理现象的情况下。
在钢筋混凝土轨道桥的设计过程中整合不确定性,在一个完全概率的框架中,使其设计更加复杂和具有挑战性。 为了传播这些不确定性并传达其对工程系统性能的影响,应该探索高维设计空间。 这里需要考虑的重大挑战在于计算负担,因为进行这样的探索活动需要对计算昂贵的有限元模拟进行大量调用。 为了应对这一挑战,在主动学习算法的背景下开发了将设计空间映射到钢筋混凝土桥性能函数的代理模型。 该模型的重要性在于它能够以最少的计算资源探索尽可能多的设计场景,并将设计场景分类为故障和安全场景。 这项工作考虑了4跨钢筋混凝土桥面。 在Cast3m中开发了这种光束的多纤维有限元素模型,以生成替代模型所需的实验设计。 进行了性能比较,以评估Kriging替代模型的有效性,并且没有主动学习,同时还评估了Kriging预测的可靠性与PC-Kriging相比。
GAMMA_FLOW是一个开源的Python包,用于对光谱数据进行实时分析。 它支持单组分和多组分光谱的分类、去噪、分解和异常检测。 而不是依靠大型的计算密集型模型,它采用监督方法的非负矩阵因子化(NMF)来减小尺寸。 这确保了快速、高效和适应性强的分析,同时降低了计算成本。 gamma_flow 实现了 90% 以上的分类精度,并实现了可靠的自动化光谱解释。 最初为伽马射线光谱开发,适用于任何类型的一维光谱数据。 作为专有软件的开放和灵活的替代方案,它支持研究和行业的各种应用。
故障区域表现出复杂和异构的渗透性结构,受到地层、组成和结构因素的影响,使它们在地下流动建模中的关键但不确定的组成部分。 在这项研究中,我们研究了使用PREDICT框架的岩石学控制如何影响断层渗透性:一种概率工作流程,将随机断层几何生成,物理约束的材料放置和基于流的升级结合起来。 然而,基于流量的升级步骤是工作流程中一个非常昂贵的计算成本组件,并提出了一个主要瓶颈,使全球灵敏度分析(GSA)难以解决,因为它需要数百万个模型评估。 为了克服这一挑战,我们开发了一个神经网络代理来模拟基于流的升级步骤。 这种替代模型大大降低了计算成本,同时保持了高精度,从而使GSA可行。 代理模型支持的GSA揭示了对光度控制对断层渗透性的影响的新见解。 除了识别主要参数和可忽略不计的参数外,该分析还揭示了传统局部灵敏度方法无法捕获的参数之间的显着非线性相互作用。
在本文中,我们提出了一种新的算法MiniFool,它实现了物理启发的对抗攻击,用于测试粒子和星射物理学中基于神经网络的分类任务。 虽然我们最初用IceCube Neutrino天文台开发了用于搜索天体物理tau中微子的算法,但我们将其应用于其他科学领域的进一步数据,从而证明了其普遍适用性。 在这里,我们将该算法应用于著名的MNIST数据集,此外,还可以从大型强子对撞机的CMS实验中打开数据数据。 该算法基于最小化成本函数,该函数将基于测试统计的χ^2与偏离预期目标分数相结合。 测试统计量根据实验的不确定性量化应用于数据扰动的概率。 对于我们研究的用例,我们发现翻转分类的可能性在最初正确和不正确分类的事件上有所不同。 当测试分类的变化作为扩展实验不确定性的攻击参数的函数时,可以量化网络决策的稳健性。 此外,这允许测试未标记的实验数据分类的稳健性。
了解和预测北极海洋环境中的降水事件,如熊岛和Ny-Ålesund,对于评估气候风险和在脆弱海洋区域发展预警系统至关重要。 这项研究提出了一个概率机器学习框架,用于建模和预测降水的动力学和严重程度。 我们首先使用小波相干分析降水与关键大气驱动因素(例如温度、相对湿度、云层覆盖和气压)之间的尺度依赖关系,该边界捕获了跨时间和频域的局部依赖关系。 为了评估联合因果影响,我们使用协同-独特-冗余分解,它量化了每个变量之间的相互作用效应对未来降水动力学的影响。 这些见解为数据驱动的预测模型的发展提供了信息,该模型结合了历史降水和因果气候驱动因素。 为了考虑不确定性,我们采用了构象预测方法,该方法能够生成校准的非参数预测间隔。 我们的研究结果强调了利用综合框架的重要性,该框架将因果分析与概率预测相结合,以提高北极海洋环境中降水预测的可靠性和可解释性。
因果推断确定了变量之间的因果关系。 虽然传统方法依靠数据来揭示因果关系,但最近开发的一种同化因果推理(ACI)方法将观测与动力学模型集成在一起。 它利用贝叶斯数据同化,通过量化不确定性的减少来追溯观察到的影响。 ACI推进了瞬时因果关系的检测和因果角色的间歇性逆转。 除了确定因果关系之外,一个同样重要的挑战是确定相关的因果影响范围(CIR),指示何时出现因果影响以及它们持续多久。 在本文中,ACI用于每次都开发前向和后CIR的数学严谨的公式。 向前CIR量化了原因的时间影响,而后向CIR则跟踪触发器的发作,以产生观察到的效果,从而分别表征每个瞬态阶段的因果可预测性和结果的归因。 引入了两个CIR的客观和稳健的指标,消除了对经验阈值的需求。 开发用于计算CIR的计算效率近似算法,这有利于将封闭形式表达式用于广泛的非线性动态系统。 数字模拟演示了这种向前和向后CIR框架如何为探测复杂的动力学系统提供新的可能性。 它推进了地球系统中分叉驱动和噪声引起的临界点的研究,研究了在确定影响范围时解决干扰变量的影响,并阐明了赤道地区的大气阻塞机制。 这些结果对科学、政策和决策有直接影响。
基于皮尔森相关性的金融网络已经进行了深入研究。 然而,以前的研究可能导致误导和灾难性的结果,因为皮尔森相关性的几个关键缺点。 局部高斯相关系数是变量之间统计依赖性的新测量,具有独特的优势,包括捕获局部非线性依赖和处理重尾分布。 这项研究使用上海证券交易所股票回报尾部区域之间的局部高斯相关系数构建金融网络。 这项工作系统地分析了基本的网络指标,包括节点中心性、平均最短路径长度和熵。 与正尾与常规的Pearson相关网络之间的局部高斯相关性网络相比,负尾之间的局部高斯相关网络的特性对股市风险更加敏感。 这一发现表明,研究人员应该优先考虑负尾之间的局部高斯相关网络。 未来的工作应该使用当地的高斯相关方法重新评估现有的发现。
Ptychography已成为使用相干光源进行高分辨率、无损成像不可或缺的工具。 ptychographic数据的处理关键依赖于稳健,高效和灵活的计算重建软件。 我们介绍了Pty-Chi,这是一个建立在PyTorch上的开源ptychographic重建包,它通过自动区分方法统一了最先进的分析算法。 Pty-Chi提供一套全面的重建算法,同时支持先进的实验参数校正,如正交探头松弛和多片建模。 利用 PyTorch 作为计算后端,可确保与供应商无关的 GPU 加速、多设备并行化以及无缝访问现代优化器。 面向对象的模块化设计使Pty-Chi具有高度的可扩展性,使研究人员能够对新成像模型进行原型设计,集成机器学习方法,或在其核心组件之上构建全新的工作流程。 我们通过具有挑战性的案例研究证明了Pty-Chi的能力,这些案例研究涉及有限的连贯性,低重叠和扫描过程中的不稳定照明,这突出了其准确性,多功能性和可扩展性。 通过社区驱动的发展和开放的贡献,Pty-Chi提供了一个现代化的,可维护的平台,用于推进计算分形图,并在同步加速器设施内外实现创新的成像算法。
估计反应速率和化学稳定性是基本的,但尽管在建模和exascale计算方面取得了进展,但大规模模拟的有效方法仍然遥不可及。 直接模拟受到短时间尺度的限制;机器学习的电位需要大型数据集,并与反应率所必需的过渡状态区域进行斗争。 足够精确的反应网络探索受到电子结构计算计算成本的阻碍,甚至像谐波过渡态理论这样的简化都依赖于昂贵的马鞍点搜索。 基于模型的加速一直很有希望,但受到开销和数字不稳定的影响。 该论文提出了一个整体解决方案,在最优运输高斯过程(OT-GP)框架中共同设计物理表示,统计模型和系统架构。 使用物理感知的最佳传输指标,OT-GP创建了具有统计学上稳健的采样的紧凑,化学相关的替代物。 除了EON软件为长时间尺度模拟重写外,我们还引入了最小模式以下(当最终状态未知时)和推力弹性带方法(指定端点时)的强化学习方法。 总的来说,这些进步建立了一个以表示为先的模块化化学动力学模拟方法。 大规模基准和贝叶斯等级验证证明了化学动力学的最先进的性能和实际探索,将长期的理论承诺转化为发现的工作引擎。
我们提出了一个通用的理论框架,用于理解基于双体相互信息扩展定律的长语建模,我们用自然语言严格验证。 我们证明双方相互信息捕获与传统的两点相互信息不同的多令牌交互和扩展,并表明这提供了准确建模长序列所需的依赖性的更完整的表征。 利用这种缩放定律,我们制定了长语模型(L^2M)条件,该条件降低了模型历史状态的必要缩放 - 负责存储过去信息的潜在变量 - 用于有效的长语境建模。 我们验证了该框架及其对变压器和状态空间模型的预测。 我们的工作提供了一个原则基础,以了解长上下文建模,并设计更高效的架构,具有更强的长语背景功能,具有超越自然语言的潜在应用。
在由模型预测控制控制的连续过程工厂中,模型-工厂不匹配(MPM)由于过程的老化而导致控制性能的退化。 我们提出了一个称为模型寿命延长(MLE)的概念及其实现,以非侵入性的方式减轻这种退化。 MLE的目的是通过使用常规操作数据不断更新(重新识别)过程模型,假设老化的时间尺度远大于引用信号的激发间隔。 我们通过L_1正则化回归估计MPM并通过交叉验证找到最佳正则化参数来实现MLE,并通过数值实验表明,通过跨验证可以存在最佳参数,并通过试点尺度蒸馏柱的交叉验证找到。 然后,我们根据找到的参数构建了更新的模型,以证明在不向处理输入注入注入注入的情况下纠正静态增益不匹配和传输延迟不匹配的可能性。
Timbre允许我们区分声音,即使它们具有相同的音高和响亮度,在音乐,乐器识别和语音中发挥重要作用。 传统方法,如频率分析或机器学习,往往忽略了声音的微妙特征。 拓扑数据分析(TDA)可以捕获复杂的模式,但它对音色的应用是有限的,部分原因是不清楚如何有效地代表TDA的声音。 在这项研究中,我们研究了不同的时间延迟嵌入如何影响TDA结果。 使用合成和真实的音频信号,我们识别时间延迟,增强谐波结构的检测。 我们的研究结果表明,与基本时期分数相关的特定延迟使TDA能够揭示关键的谐波特征,并区分整数和非整数谐波。 该方法对合成和真实乐器声音有效,为未来的作品开辟了道路,可以使用更高维度的嵌入和额外的持久性统计将其扩展到更复杂的声音。
图形上扩散过程的建模是许多网络科学和机器学习方法的基础。 最近采用了基于网络扩散的熵措施,以调查这些过程的可逆性和建模系统的多样性。 虽然关于它们稳定状态的结果是众所周知的,但关于它们的时间演变的确切结果很少。 在这里,我们在图中介绍热扩散的条件熵。 我们证明这种熵测量满足了热力学第一和第二定律,从而提供了对网络上扩散动力学的物理解释。 我们概述了一个数学框架,在连续时间马尔可夫链和信息理论中将扩散和条件熵进行上下背景。 此外,我们在完整、路径和圆曲图上获得其演变的明确结果,以及 Erdös-Rényi 图的均场近似值。 我们还为一般网络获得渐近结果。 最后,我们实验演示了条件熵在随机图上扩散的几个特性,例如Watts-Strogatz模型。
粉末X射线衍射(XRD)是表征晶体材料的基础技术。 然而,对XRD模式的可靠解释,特别是在多阶段系统中,仍然是一项手工和需要专门知识的任务。 作为仅提供结构信息的表征方法,多个参考阶段通常可以适合单一模式,导致在忽略替代解决方案时潜在的误解。 为了减轻人类的努力并应对挑战,我们引入了Dara(数据驱动的自动Rietveld Analysis),这是一个旨在自动从粉末XRD数据中稳健识别和完善多个阶段的框架。 Dara对给定化学空间内的所有合理相组合进行了详尽的树搜索,并使用强大的Rietveld精加工例程(BGMN)验证每个假设。 主要功能包括结构数据库过滤,在树木扩展期间自动聚类结构相位,基于峰值匹配的评分,以确定有希望的改进阶段。 当模棱两可存在时,Dara会产生多个假设,然后由人类专家或进一步的特征工具决定。 通过增强相位识别的可靠性和准确性,Dara能够对逼真的复杂XRD模式进行可扩展的分析,并为集成到多模态表征工作流程,实现完全自动驾驶材料发现奠定了基础。
机器学习可以实现强大的宇宙学推理,但通常需要许多高保真模拟,涵盖许多宇宙学模型。 迁移学习提供了一种通过跨模型重用知识来降低模拟成本的方法。 我们展示了对宇宙学,ΛCDM和各种超越ΛCDM场景(包括海量中微子,修饰重力和原始非高斯性)的标准模型的预训练,可以通过显着更少的超越ΛCDM模拟实现推理。 然而,我们也表明,当ΛCDM和超越-ΛCDM参数之间存在强物理退化时,可能会发生负转移。 我们考虑各种传输架构,发现包括瓶颈结构提供最佳性能。 我们的发现说明了物理学基础模型方法的机会和陷阱:预训练可以加速推理,但也可能阻碍学习新的物理学。
抽象是从原始数据中提取基本特征,而忽略无关的细节。 众所周知,抽象在神经网络中存在深度,其中深层通过结合在浅层(例如边缘)中编码的较低层次特征来捕获数据的抽象特征。 然而,我们认为,仅靠深度不足以发展真正抽象的表征。 我们主张抽象的层次关键取决于训练集的广度。 我们在一个重新规范化的小组方法中解决这个问题,其中表示被扩展为包含更广泛的数据集。 我们将这种转变的独特固定点 - 分层特征模型 - 作为绝对抽象的表示的候选。 这种理论图在基于深度信念网络和基于不同广度数据的自动编码器的数值实验中进行测试。 这些表明,随着数据变得越来越广泛,随着理论预测的一致,神经网络中的表征接近层次特征模型。
继续滚动加载更多