凝聚态物理学
Condensed Matter
无序系统与神经网络
Disordered Systems and Neural Networks
材料科学
Materials Science
介观与纳米尺度物理学
Mesoscale and Nanoscale Physics
热态在物理学的各个领域发挥着根本性的作用,在量子信息科学中变得越来越重要,与半定义编程、量子玻尔兹曼机器学习、哈密尔顿学习以及估计哈密尔顿语参数的相关任务相关的应用。 在这里,我们建立了参数化热态基本几何的公式,我们划定了用于估计这些公式值的量子算法。 更具体地说,我们建立了参数化热态的Fisher-Bures和Kubo-Mori信息矩阵的公式,我们用于估计其矩阵元素的量子算法涉及经典采样,Hamiltonian模拟和Haddamard测试的组合。 这些结果适用于开发量子玻尔兹曼机器学习的自然梯度下降算法,该算法考虑了热态的几何形状,并在获得热态样本时对估计哈密尔顿的参数的能力建立基本限制。 对于后一个任务,对于估计单个参数的特殊情况,我们勾勒出一种算法,该算法实现了对估计任务无症状最佳测量。 我们最后强调,这里开发的自然梯度下降算法可用于任何使用量子玻尔兹曼机器的机器学习问题。
核心外壳电极颗粒是高性能锂离子电池的一种有前途的形态控制策略。 然而,实验观察表明,这些结构仍然容易发生机械故障,一次充电后会发生壳体断裂和核心壳脱壳。 在这项工作中,我们提出了一个新的,全面的计算框架,以预测和深入了解核心壳形态的失败以及电池性能的相关退化。 提供的完全耦合的化学损伤模型捕获了机械损伤和电化学行为之间的相互作用,使粒子裂解和容量褪色量化。 散装材料断裂和界面脱粘都是通过使用相位场方法捕获的。 我们通过对具有代表性的芯壳系统(NMC811@NMC532)的案例研究,量化了粒子裂解和容量损失的严重程度。 这些结果为破解模式,潜在机制及其对容量损失的影响带来了宝贵的见解。 当与外壳相比,在核心中积累显着更高的锂浓度时,发现表面裂纹。 界面上的脱垢被证明是由于外壳扩展更大的外壳接口附近的局部箍应力而产生的。 这种脱粘剂迅速发展,阻碍了锂离子的运输,并且在一次放电后可能导致超过10%的容量损失。 此外,较大的粒子可能会经历由广泛的拉伸区驱动的裂纹分支,可能会使整个粒子碎片化。 开发的框架不仅可以为核心壳颗粒的降解机制带来新的见解,而且还可用于设计具有改进性能和延长使用寿命的电极材料。
在前馈神经网络中,已经开发了无数据集重初始化方法,如LeCun,Xavier(或Glorot)和He初始化。 这些方法根据特定分布(例如,高斯或均匀分布)随机确定重量参数的初始值,而无需使用训练数据集。 据作者所知,这种无数据集的权重初始化方法尚未开发用于受限制的玻尔兹曼机器(RBM),这是由两层组成的概率神经网络。 在这项研究中,我们根据统计机械分析为Bernoulli-Bernoulli RBMs导出了无数据集权重初始化方法。 在拟议的权重初始化方法中,权重参数来自高斯分布,零均值。 高斯分布的标准差是根据我们的假设优化的,即两层之间提供更大层相关性(LC)的标准差提高了学习效率。 LC的表达是基于统计力学分析得出的。 标准差的最佳值对应于 LC 的最大点。 提出的权重初始化方法在特定情况下与Xavier初始化相同(即当两个层的大小相同时,层的随机变量为{-1,1}-二进制,所有偏置参数为零)。 拟议的权重初始化方法的有效性在使用玩具和现实世界数据集的数值实验中得到证明。
模拟微观结构演变(MicroEvo)对于材料设计至关重要,但需要高数值精度,效率和物理保真度。 虽然最近关于深度学习(DL)的研究为传统求解者提供了一种有希望的替代方案,但该领域缺乏标准化的基准。 由于缺乏将专门的MicroEvo DL模型与最先进的时空架构进行比较,现有研究存在缺陷,过分强调数值精度对物理保真度的影响,以及未能随着时间的推移分析错误传播。 为了解决这些差距,我们引入了MicroEvoEval,这是基于图像的微观结构进化预测的第一个综合基准。 我们评估了14个模型,包括特定领域和通用架构,跨越四个具有代表性的MicroEvo任务,这些数据集专门用于短期和长期评估。 我们的多方面评估框架超越了数值准确性和计算成本,包括一组精心策划的结构保护指标来评估物理保真度。 我们广泛的评估产生了几个关键见解。 值得注意的是,我们发现现代架构(例如VMamba)不仅实现了卓越的长期稳定性和物理保真度,而且还具有更高的计算效率。 结果强调了整体评估的必要性,并将这些现代架构确定为在数据驱动材料科学中开发高效可靠的替代模型的非常有前途的方向。
先进金属合金的发现受到广阔的成分空间,相互竞争的属性目标和现实世界对可制造性的限制的阻碍。 在这里,我们介绍了MATAI,一个用于属性预测和作为铸造合金的反向设计的通用机器学习框架。 MATAI集成了一个策划的合金数据库、基于深度神经网络的属性预测器、约束感知优化引擎和迭代的AI-实验反馈循环。 该框架估计了关键的机械属性,包括密度,屈服强度,最终拉伸强度和拉长,直接从组成,使用多任务学习和物理知识的电感偏差。 合金设计被设计为一个受约束的优化问题,并使用将本地搜索与符号约束编程相结合的双级方法解决。 我们展示了MATAI在基于Ti的合金系统上的能力,该系统是轻质结构材料的标准类,它通过7次迭代快速识别同时实现较低密度(<4.45 g/cm3),强度更高(>1000 MPa)和可欣赏的延展性(>5%)的候选者。 实验验证证实,MATAI设计的合金优于TC4等商业参考,突出了该框架在现实设计限制下加速发现轻量化高性能材料的潜力。
边缘人工智能的指数级增长需要以材料为中心的解决方案,以克服处理实时时间数据时的能源消耗和延迟限制。 物理储层计算(PRC)提供了一种节能的范式,但由于设备可扩展性和可重新配置性有限,因此面临挑战。 此外,存储库和读出层需要分别对不同时间尺度、短期和长期记忆,这是阻碍CMOS兼容实现的重大挑战。 这项工作展示了一种CMOS兼容的铁电晶体管,使用铬-氧化锆(HZO)和硅,可实现双内存操作。 该系统从铁电HZO偏振和由栅极化驱动的工程非准静态(NQS)通道电荷松弛的非易失性长期记忆(LTM)表现出非易失性长期记忆(LTM)。 铁电偏振作为挥发性动力学的非易失性编程:通过调节阈值电压,铁电状态确定性地切换配对脉冲促进(PPF)和抑郁(PPD)之间的NQS时间常数和计算行为。 这建立了一个适用于各种铁电半导体异质结构的通用材料设计原理,从硅扩展到氧化物半导体和异构集成系统。 该设备仅使用16个储层状态 - 5倍减少 - 实现20个响应时间(1000倍快)和1.5 x 10^-7 J能耗,以3.69 x 10^-3的规范化错误解决二阶非线性任务,为神经形态硬件和节能边缘智能提供立即可制造的途径。
构图预测已成为构建预测间隔的有力工具,该预测间隔以无分布方式有效。 然而,其评估可能具有计算成本,特别是在高维设置中,尺寸和样本大小都很大且具有可比的幅度。 为了在广义线性回归的背景下应对这一挑战,我们提出了一种基于近似消息传递(AMP)的新算法,通过近似合格分数的计算,使用完整的构象预测加速预测间隔的计算。 我们的工作弥合了现代不确定性量化技术和涉及AMP算法的高维问题工具之间的差距。 我们在合成和真实数据上评估我们的方法,并表明它产生的预测间隔接近基线方法,同时速度要快一些。 此外,在高维极限和数据分布假设下,AMP计算的合格分数收敛到精确计算的合格分数,从而允许在高维度上对构象方法进行理论研究和基准测试。
组织模型是固体力学和材料科学的基础,支持在不同负载条件下对材料响应的定量描述和预测。 传统的现象学模型是通过经验拟合得出的,它们往往缺乏可推广性,严重依赖专家直觉和预先定义的功能形式。 在这项工作中,我们提出了一个基于图形的方程发现框架,用于直接从多源实验数据自动发现构成定律。 这个框架将方程表示为定向图,其中节点表示运算符和变量,边缘表示计算关系,边缘特征编码参数依赖关系。 这可以实现使用未确定的材料特定参数的自由形式符号表达式的生成和优化。 通过拟议的框架,我们发现了合金钢材料应变率效应和锂金属变形行为的新构成模型。 与传统的实证模型相比,这些新模型表现出紧凑的分析结构,并达到更高的精度。 拟议的基于图的方程发现框架为数据驱动的科学建模提供了一种可推广和可解释的方法,特别是在传统经验公式不足以代表复杂物理现象的情况下。
强化微调在增强大型语言模型的教学跟踪和推理能力方面发挥了重要作用。 在这项工作中,我们采用材料设计的加固微调,其中使用判别神经系统模型为自动回归变压器基材料生成模型CrystalFormer提供奖励。 通过优化奖励信号 - 例如凸体上方的能量和优点增强微调的材料属性数字将来自判别模型的知识注入生成模型。 生成的模型CrystalFormer-RL显示了生成晶体的稳定性增强,并成功发现了具有理想但冲突的材料特性的晶体,例如同时具有实质性的介电常数和带隙。 值得注意的是,我们观察到强化微调不仅实现了属性引导材料设计,而且还可以解锁预训练生成模型的基于属性的材料检索行为。 本框架为机器学习生态系统在材料设计方面的协同效应打开了一个令人兴奋的门户。
多索引模型 - 函数仅依赖于其投影在子空间上的非线性变换 - 是使用神经网络研究特征学习的有用基准。 本文研究了本假设类中高效可学习性的理论边界,侧重于用一阶迭代算法弱恢复其低维结构所需的最小样本复杂性,在高维方案中,样本 n=α d 的数量与协方差维度 d 成正比。 我们的发现分为三部分:(i)我们确定在哪些条件下,可以通过任何 α>0; (ii) 单序算法的单步学习一个微不足道的子空间,如果琐碎子空间是空的,我们为一个简单的子空间的存在提供了必要和充分的条件,其中只能在某个样本复杂度 α>α_c 之上学习方向,其中α_c标记了计算阶段的过渡。 在一组有限但有趣的真正困难的方向 - 类似于平价问题 - α_c被发现存在差异。 最后,(iii)我们表明,不同方向之间的相互作用会导致复杂的分层学习现象,当耦合到更容易时,可以依次学习方向。 我们详细讨论了与这些功能相关的大楼梯图片(并将其与原始楼梯进行比较)。 我们的理论建立在一阶迭代方法中近似消息传递的最优性之上,在广泛的算法中划定了基本的可学习性极限,包括受过梯度下降训练的神经网络,我们在此背景下进行了讨论。
最近提出了从玻尔兹曼分布中采样蛋白质构象的深层生成模型,作为通常令人望而却步的分子动力学模拟的替代品。 然而,当前最先进的方法依赖于微调预训练的折叠模型和进化序列信息,限制了它们的适用性和效率,并引入了潜在的偏见。 在这项工作中,我们提出了一个仅基于主干几何形状的采样蛋白质构象的流匹配模型 - BBFlow。 我们引入了骨干平衡结构的几何编码作为输入,并提议不仅对流量进行条件,而且还对各自平衡结构的先验分布进行条件,从而消除了对进化信息的需求。 由此产生的模型比当前最先进的方法更快,可与多链蛋白相转移,并且可以在几天内从头开始训练。 在我们的实验中,我们证明拟议的模型通过减少推理时间来实现竞争性能,不仅跨越了自然存在的蛋白质的既定基准,而且还跨越了新蛋白质,其中进化信息很少或不存在。 BBFlow可在https://github.com/graeter-group/bbflow查阅。
与密度功能理论计算相比,机器学习间原子电位(MLIP)平衡了高精度和更低的成本,但它们的性能通常取决于训练数据集的大小和多样性。 大型数据集提高了模型的准确性和概括性,但在生产和训练方面成本高昂,而较小的数据集可能会丢弃罕见但重要的原子环境并损害MLIP的准确性/可靠性。 在这里,我们开发了一个信息理论框架,以量化数据集压缩方法的效率,并提出了一种最大化这种效率的算法。 通过将原子数据集压缩作为以原子为中心的环境的最小集覆盖(MSC)问题的实例,我们的方法确定了最小的结构子集,这些结构包含尽可能多的原始数据集,同时修剪冗余信息。 该方法在GAP-20和TM23数据集上进行了广泛演示,并在ColabFit存储库的64个不同数据集上进行了验证。 在所有情况下,MSC始终保留异常值,保留数据集多样性,即使在高压缩率下也能再现力的长尾分布,优于其他子采样方法。 此外,在MSC压缩数据集上训练的MLIP即使在低数据机制中也表现出减少的分配外数据的错误。 我们使用异常分析来解释这些结果,并表明这种定量结论无法用传统的降维方法实现。 该算法在开源QUESTS包中实现,可用于原子建模中的几项任务,从数据子采样,异常检测和以更低的成本训练改进的MLIP。
过程结构-属性关系是材料科学和工程的基础,是开发新的和改进的材料的关键。 符号回归是揭示描述这些关系的数学模型的有力工具。 它可以自动生成方程来预测特定制造条件下的材料行为,并优化强度和弹性等性能特性。 本作品说明了符号回归如何导出描述各种金属合金在塑性变形过程中行为的构成模型。 组织建模是一个数学框架,用于理解不同加载条件下材料中应力和应变之间的关系。 在这项研究中,两种材料(可老化的铝合金和高铬马氏体钢)和两种不同的测试方法(压缩和张力)被认为是获得所需的应力应变数据。 结果强调了使用符号回归的好处,同时也讨论了潜在的挑战。
无噪音压缩传感是一个两步设置,允许对稀疏信号进行采样,然后在不丢失信息的情况下重建它。 LASSO算法基于正则化,为解决这个问题提供了一种高效和稳健的算法,但它在压缩率非常高的制程中失败。 在这里,我们介绍了基于-规范正则化的两种算法,这些算法在测量矩阵的 Gaussian 设计设置中的压缩率方面优于 LASSO。 这些算法基于近似调查传播,这是近似消息传递类中的算法家族。 在大型系统限制中,它们可以通过状态进化方程进行严格的跟踪,并且可以精确预测可能完美信号重建的范围压缩速率。 我们还提供了 -orm 无噪声抗压传感模型的统计物理分析。 我们展示了复制对称状态和1步复制对称断裂(1RSB)状态的存在,以实现足够低的规范正则化。 我们算法的恢复限制与 1RSB 解决方案的行为相关联。
纳米材料表现出独特的特性,由尺寸,形状和表面特征等参数控制,这些参数严重影响了它们在整个技术,生物和环境环境中的应用和相互作用。 准确量化和理解这些材料对于推进研究和创新至关重要。 在这方面,深度学习分割网络已成为强大的工具,可以实现自动化的见解,并以精确的定量分析取代主观方法。 然而,它们的功效取决于具有代表性的注释数据集,由于纳米颗粒的昂贵成像和手动注释的劳动密集型性质,这些数据集很难获得。 为了克服这些限制,我们引入了DiffRenderGAN,这是一种新颖的生成模型,旨在产生注释合成数据。 通过将可微分渲染器集成到生成对抗网络(GAN)框架中,DiffRenderGAN优化了纹理渲染参数,以生成来自非注释的真实显微镜图像的逼真,注释的纳米颗粒图像。 这种方法减少了手动干预的需求,并通过生成多样化和现实的数据,提高了与现有合成数据方法的分割性能。 在多个离子和电子显微镜外壳上进行测试,包括二氧化钛(TiO_2),二氧化硅(SiO_2)和银纳米线(AgNW),DiffRenderGAN弥合了合成和真实数据之间的差距,推进了复杂纳米材料系统的量化和理解。
点缺陷支配着二维(2D)材料的许多重要功能特性。 然而,解决多层2D材料中这些缺陷的三维(3D)排列仍然是一个根本性的挑战,阻碍了合理的缺陷工程。 在这里,我们使用人工智能引导的电子显微镜工作流程来克服这一限制,以绘制 MXene 中原子空置的3D拓扑和聚类。 我们的方法重建了数千个格子站点的空缺的3D坐标,从而对它们的分布产生了强大的统计洞察力,这些分布可能与特定的合成途径相关。 这种大规模数据使我们能够对缺陷结构的层次结构进行分类 - 从孤立的空缺到纳米孔 - 揭示了他们的首选形成和相互作用机制,正如分子动力学模拟所证实的那样。 这项工作为理解和最终控制大批量的点缺陷提供了一个可通用的框架,为合理设计缺陷工程功能2D材料铺平了道路。
三维(3D)集成继续推进摩尔定律,促进密集的互连和启用多层系统架构。 在各种集成方法中,Cu-Cu混合粘接已成为实现芯片集成中高互连密度的领先解决方案。 在这项工作中,我们介绍了YAP +,这是一个专门为晶圆到晶圆(W2W)和模对晶(D2W)混合粘合工艺量身定制的产量建模框架。 YAP+包含一套全面的产量影响失效机制,包括覆盖层错位,粒子缺陷,Cu凹陷变化,表面粗糙度和Cu垫密度。 此外,YAP+支持垫布局感知产量分析,考虑任意2D物理布局模式的关键,冗余和虚拟垫。 为了支持实际评估,我们开发了一个开源产量模拟器,证明我们的近分析模型与模拟精度相匹配,同时在运行时实现了超过1000倍的加速。 这种性能使YAP+成为共同优化包装技术、装配设计规则和系统级设计策略的宝贵工具。 除了W2W-D2W比较之外,我们还利用YAP +来研究不同垫类型的垫布局模式,粘合间距和垫比的影响,并探索战略性放置冗余垫复制品的好处。
在本手稿中,我们研究了深度注意力神经网络的学习,该网络被定义为多个自我关注层的组成,具有并列和低等级权重。 我们首先建立此类模型的映射,以对多索引模型进行排序,将广泛研究的多索引模型泛化到顺序协方差,为此我们建立了许多一般结果。 在贝叶斯最优学习的背景下,在大尺寸D和可数数量样本N的极限中,我们对最佳性能以及该设置中最著名的多项式时间算法(即近似消息传递)的性能进行了尖锐的渐近表征,并表征了优于随机预测性能所需的最小样本复杂性的尖锐阈值。 我们的分析特别揭示了不同层是如何依次学习的。 最后,我们讨论如何在现实的设置中也可以观察到这种顺序学习。
图中的独立集合是包含没有邻居的顶点集,它们表示具有硬核约束的规范自旋系统。 特别令人感兴趣的是布尔超立方体的设置,其中计数独立集是Sapozhenko著名的图形容器方法的原始激励因素。 对这些问题的现代观点是考虑无序的影响,通过带参数p的键层的超立方体随机子图中独立集合的研究是由Kronenberg和Spinka发起的。 他们使用统计力学的工具来获取有关独立集合数(现在是随机变量)时刻的详细信息,并提出了许多有趣的问题。 作者之前的工作解决了政权p ≥2/3中的许多问题,其中行为相对简单,可以由相关的独立粒子家族很好地建模。 然而,随着p的减少,典型的独立集合变得更大,并且具有更复杂的聚类行为。 在本文中,我们克服了这一现象带来的许多挑战,并分析了所有p> 0.465的模型。 我们获得了对显式随机变量中独立集合数量的急剧概率近似,并提供采样算法。 请注意,奇怪的是,这表明p = 1/2不是这个问题的天然屏障,不像许多其他问题,它表现为相变的点。 这项工作的一个关键贡献是引入了一个新的概率框架来处理这些低值 p 的聚类行为。 虽然我们的分析仅限于p > 0.465,但我们的论点有望在更低值的p下研究该模型,并可能用于其他相关问题。
在这份手稿中,我们考虑了学习由双层自动编码器进行参数化的流动或基于扩散的生成模型的问题,该模型通过在线随机梯度下降训练,在具有底层低维流形结构的高维目标密度上。 我们对学习模型生成的样本分布的低维投影进行了严格的渐近表征,特别是确定其对训练样本数量的依赖。 基于此分析,我们讨论了模式崩溃如何产生,并导致模型在生成模型在生成的合成数据上重新训练时崩溃。
继续滚动加载更多