随着电动汽车(EV)行业的增长,对高纯度锂的需求激增,从Smackover Formation等低档北美来源的具有成本效益的提取至关重要。 这些资源与高纯度的南美盐水不同,需要创新的净化技术在经济上可行。 连续结晶是生产电池级碳酸锂的一种有希望的方法,但其优化受到复杂参数空间和有限数据的挑战。 本研究引入了人圈(HITL)辅助主动学习框架,以优化碳酸锂的连续结晶。 通过将人类专业知识与数据驱动的见解相结合,我们的方法加速了从具有挑战性的来源提取锂的优化。 我们的研究结果证明了该框架能够快速适应新数据,显著提高了该工艺对镁等关键杂质的耐受性,从行业标准的几百 ppm提高到高达6000 ppm。 这一突破使低品位、杂质丰富的锂资源的开采变得可行,有可能减少对广泛的预精炼工艺的需求。 通过利用人工智能,我们改进了操作参数,并证明可以在不牺牲产品质量的情况下使用低档材料。 这一进步是在经济上利用北美庞大的锂储量(如Smackover Formation)和提高全球锂供应链可持续性的重要一步。
机器学习的原子间潜力已经成为材料科学不可或缺的工具,能够研究更大的系统和更长的时间尺度。 最先进的模型通常是图形神经网络,它使用传递消息来迭代更新原子嵌入,最终用于预测属性。 在这项工作中,我们扩展了传递形式主义的信息,并包含一个连续变量,该变量解释了分数原子的存在。 这使我们能够计算吉布斯自由能量相对于原子的笛卡尔坐标及其存在的梯度。 使用它,我们提出了一种基于梯度的大规范优化方法,并记录了其Cu(110)表面氧化物的能力。
高性能非晶合金的设计在各种应用中都存在迫切需求,但这一过程严重依赖经验法则和无限尝试。传统策略的高成本与低效特性阻碍了在巨大材料空间中的有效采样。本文提出材料网络方法来加速二元和三元非晶合金的发现。网络拓扑结构揭示了被传统表格数据表示所掩盖的潜在候选材料。通过分析不同年份合成的非晶合金,我们构建了动态材料网络来追踪合金发现的历史。研究发现,过去设计的一些创新材料已被编码在这些网络中,证明了它们在指导新合金设计方面的预测能力。这些材料网络与日常生活中的若干现实网络表现出物理相似性。我们的发现为智能材料设计(特别是复杂合金)开辟了新途径。
释放纳米材料在医学和环境科学中的潜力取决于理解它们与蛋白质的相互作用,这是一个复杂的决策空间,人工智能准备产生变革性影响。 然而,由于数据集有限和现有模型的可推广性受限,进展受到了阻碍。 在这里,我们提出了NanoPro-3M,这是迄今为止最大的纳米材料-蛋白质相互作用数据集,包括超过320万个样本和37,000个独特的蛋白质。 利用这一点,我们介绍了NanoProFormer,这是一个基础模型,通过多模态表示学习预测纳米材料-蛋白质亲和力,展示强大的泛化,处理缺失的特征以及看不见的纳米材料或蛋白质。 我们表明,多模态建模显著优于单模态方法,并确定了日冕形成的关键决定因素。 此外,我们通过零镜头推理和微调证明了它对一系列下游任务的适用性。 这项工作共同为纳米材料-蛋白质相互作用终点的高性能和广义预测奠定了坚实的基础,减少了实验依赖并加速了各种体外应用。
基于扩散的深层生成模型已成为逆材料设计的强大工具。 然而,许多现有的方法忽略了基本的化学约束,如氧化状态平衡,这可能导致化学无效结构。 在这里,我们介绍了CrysVCD(带有Valence-Constrained Design的Crystal发生器),这是一个将化学规则直接集成到生成过程中的模块化框架。 CrysVCD首先采用基于变压器的元素语言模型来生成价平衡的成分,然后使用扩散模型来生成晶体结构。 与筛选后纯数据驱动方法相比,价差约束使数量顺序更高效的化学价位检查。 在稳定性指标上微调时,CrysVCD达到85
随着电动汽车(EV)行业的增长,对高纯度锂的需求激增,从Smackover Formation等低档北美来源的具有成本效益的提取至关重要。 这些资源与高纯度的南美盐水不同,需要创新的净化技术在经济上可行。 连续结晶是生产电池级碳酸锂的一种有希望的方法,但其优化受到复杂参数空间和有限数据的挑战。 本研究引入了人圈(HITL)辅助主动学习框架,以优化碳酸锂的连续结晶。 通过将人类专业知识与数据驱动的见解相结合,我们的方法加速了从具有挑战性的来源提取锂的优化。 我们的研究结果证明了该框架能够快速适应新数据,显著提高了该工艺对镁等关键杂质的耐受性,从行业标准的几百 ppm提高到高达6000 ppm。 这一突破使低品位、杂质丰富的锂资源的开采变得可行,有可能减少对广泛的预精炼工艺的需求。 通过利用人工智能,我们改进了操作参数,并证明可以在不牺牲产品质量的情况下使用低档材料。 这一进步是在经济上利用北美庞大的锂储量(如Smackover Formation)和提高全球锂供应链可持续性的重要一步。
机器学习的原子间潜力已经成为材料科学不可或缺的工具,能够研究更大的系统和更长的时间尺度。 最先进的模型通常是图形神经网络,它使用传递消息来迭代更新原子嵌入,最终用于预测属性。 在这项工作中,我们扩展了传递形式主义的信息,并包含一个连续变量,该变量解释了分数原子的存在。 这使我们能够计算吉布斯自由能量相对于原子的笛卡尔坐标及其存在的梯度。 使用它,我们提出了一种基于梯度的大规范优化方法,并记录了其Cu(110)表面氧化物的能力。
基于扩散的深层生成模型已成为逆材料设计的强大工具。 然而,许多现有的方法忽略了基本的化学约束,如氧化状态平衡,这可能导致化学无效结构。 在这里,我们介绍了CrysVCD(带有Valence-Constrained Design的Crystal发生器),这是一个将化学规则直接集成到生成过程中的模块化框架。 CrysVCD首先采用基于变压器的元素语言模型来生成价平衡的成分,然后使用扩散模型来生成晶体结构。 与筛选后纯数据驱动方法相比,价差约束使数量顺序更高效的化学价位检查。 在稳定性指标上微调时,CrysVCD达到85
具有原子分辨率的越来越大型的微观图像数据集促进了机器学习方法的开发,以识别和分析嵌入在图像中的细微物理现象。 在这项工作中,蜂窝晶格自旋冰样品的微观图像作为数据集,我们从中自动计算净磁矩和自旋冰配置的方向。 在我们工作流程的第一阶段,机器学习模型经过训练,可以准确预测自旋冰结构中的磁矩和方向。 Variational Autoencoders(VAEs)是一种新兴的无监督深度学习技术,用于生成高质量的合成磁力显微镜(MFM)图像并提取潜在的特征表示,从而减少实验和分割错误。 提出的第二阶段方法能够精确识别和预测受挫的顶点和纳米磁段,有效地将微观图像的结构和功能方面联系起来。 这有利于设计优化的自旋冰配置,具有受控制的挫折模式,从而实现潜在的按需合成。
多切片电子分形(MEP)是一种逆成像技术,可计算从衍射模式中重建原子晶体结构的最高分辨率图像。 可用的算法通常迭代地解决这个反向问题,但由于其不良性质,既耗时又产生次优解决方案。 我们开发MEP-Diffusion,这是一种在大型晶体结构数据库中训练的扩散模型,专门用于MEP,以增强现有的迭代求解器。 MEP-Diffusion通过Diffusion后采样(DPS)作为生成物预先集成到现有的重建方法中。 我们发现这种混合方法大大提高了重建的3D卷的质量,实现了90.50。
高效合成新材料在各个研究领域都很高要求。 然而,这个过程通常是缓慢而昂贵的,特别是对于金属眼镜,其形成强烈取决于多种元素的最佳组合来抵抗结晶。 自1960年以来,这一限制只能在广阔的物质空间中探索了数千名候选人。 最近,由先进的机器学习技术武装的数据驱动方法为智能材料设计提供了替代途径。 由于数据稀缺和不成熟的材料编码,传统的表格数据通常由统计学习算法挖掘,从而限制了模型的可预测性和可推广性。 在这里,我们提出从材料网络表示中学习复杂的数据。 节点元素由维基百科语言模型编码。 具有多功能架构的图形神经网络旨在作为推荐系统,以探索材料之间的隐藏关系。 通过采用不同语言的维基百科嵌入,我们评估自然语言在材料设计中的能力。 我们的研究提出了一种新的范式,以收获新的无定形材料以及人工智能。
MatSSL是一个精简的自我监督学习(SSL)架构,在骨干的每个阶段使用Gated Feature Fusion来有效地集成多级表示。 目前对金属材料的微图分析依赖于监督方法,该方法需要为每个新数据集进行再训练,并且通常与只有少数标记的样本不一致。 虽然SSL通过利用未标记的数据提供了一个有希望的替代方案,但大多数现有方法仍然依赖于大规模数据集才能有效。 MatSSL旨在克服这一限制。 我们首先在小规模、未标记的数据集上执行自我监督预训练,然后在多个基准数据集上微调模型。 生成的分割模型达到69.13
液态金属(LM)嵌入在弹性体基质中,以获得具有独特热、介电和机械性能的软复合材料。 他们在软机器人、生物医学工程和可穿戴电子产品方面有应用。 通过将结构与这些材料的特性联系起来,可以合理地执行材料设计。 液态金属嵌入式弹性体(LMEE)通过在变异自动编码器网络(VAE)中半监督学习结构-属性(SP)链接,为靶向电热机械性能而设计。 设计参数是具有物理意义的微结构描述符,与研究颗粒复合材料的合成具有亲和关系。 机器学习(ML)模型是在微结构描述符的生成数据集上训练的,其多功能属性量作为标签。 Sobol序列用于实验的硅设计(DoE),通过采样设计空间,通过包装算法生成3D微观结构实现的综合数据集。 生成的微观结构的机械响应使用先前开发的有限元件(FE)模型进行模拟,考虑到LM内含物引起的表面张力,而线性热和介电常数在我们的内部快速傅变(FFT)包的帮助下被同质化。 通过最小化适当的损失函数进行训练后,VAE编码器充当多功能同质化数值求解器的替代物,其解码器用于材料设计。 我们的研究结果表明,在LMEE实验结果验证的高保真数值模拟方面,代理模型和反向计算器的满意性能。
合成序列控制的聚合物有望通过将合成聚合物的化学多功能性与生物蛋白质的精确序列介导功能相结合来改变聚合物科学。 然而,事实证明,这些材料的设计极具挑战性,因为它们缺乏密切相关的进化分子的大量数据集,这些分子加速了蛋白质的设计。 在这里,我们报告一项新的人工智能战略,以大幅减少加速这些材料设计所需的数据量。 我们专注于将相容分子的重复单元序列与其降低不同聚合物域之间的界面张力的能力联系起来的数据。 这些分子的最佳序列对于混合废物聚合物回收等应用至关重要,强烈依赖于聚合物的浓度和化学细节等变量。 对于当前的方法,这将需要一个完全不同的数据集来在每个条件下实现设计。 在这里,我们展示了一个在一组条件下对序列/界面张力关系低保真数据进行训练的深度神经网络可以快速调整,以便在一组不同的条件下进行更高保真度的预测,需要的数据要少得多。 这种启动和调整方法应该允许单个低保真父数据集大大加速整个相关系统中的预测和设计。 从长远来看,它还可能提供了一种从快速,粗糙的模拟中引导定量原子设计的方法。
我们建议为生成稳定材料进行微调大型语言模型。 虽然非正统,在文本编码的原子数据上微调大型语言模型易于实现但可靠,约90个
通过分析实验捕获的图像中的模式来了解动态多体系统的行为和演变,是一种与各种生活和非生活自我组装系统相关的有希望的方法。 这里研究的移动液晶天团阵列是分层组织材料的一个代表性例子,这些材料表现出由多尺度过程驱动的复杂的时空动力学。 联合几何和拓扑数据分析(TDA)提供了一个强大的框架,通过在多个尺度上捕获数据的底层结构来研究这些系统。 在TDA方法中,我们引入了Ψ函数,一个健壮的数值拓扑描述符,既与单个拓扑单体的大小和形状的时空变化以及具有不同空间组织的区域的出现有关。 基于从skyrmion合奏图像产生的矢量场分析的几何方法提供了对系统对外部刺激反应的非线性物理机制的见解,并为与理论预测的比较提供了基础。 这里介绍的方法非常通用,可以在单个模式形成剂和整体水平上提供系统行为的表征,允许将图像数据分析的结果与现实世界中物理,化学或生物系统中发生的过程联系起来。
我们表明,生成对抗网络(GAN)可能会有效地利用来学习随机动力学,在捕捉热波动的同时推测传统模型。 具体来说,我们将应用展示到二维,多粒子系统,重点关注表面步向波动和相关的时间依赖性粗糙度。 在构建基于Kinetic Monte Carlo模拟的数据集后,对条件GAN进行了训练,以及时传播系统的状态,从而能够以较低的计算成本生成新序列。 讨论了标准GAN的修改,这些修改有助于融合和提高准确性。 训练后的网络被证明可以定量地再现平衡和动力学特性,包括缩放定律,偏离确切值的几个百分点。 推断限制和未来前景进行了批判性的讨论。
材料科学本质上跨越学科:实验者使用先进的显微镜来揭示微观和纳米级结构,而理论家和计算科学家则开发将处理,结构和属性联系起来的模型。 弥合这些领域对于逆材料设计至关重要,您可以从所需的性能开始,向后工作到最佳的微观结构和制造路线。 将高分辨率成像与预测模拟和数据驱动优化相结合,可加速发现并加深对过程-结构-属性关系的理解。 可微分的物理框架 evoxels 基于完全 Pythonic,统一的基于 voxel 的方法,该方法集成了分割的 3D 显微镜数据、物理模拟、逆建模和机器学习。
我们分析了两种策略在解决凝聚态物理中Bethe-Salpeter方程(BSE)衍生的结构化特征值问题的表现。 BSE矩阵是用代码构建的,这两个策略是通过与ScaLAPACK和ELPA库进行直接对角化,并与SLEPc库进行迭代方法来实现的。 我们考虑Hermitian(Tamm-Dancoff近似)和伪Hermitian形式,解决三种不同尺寸的密集矩阵。 还提供了实施说明,并详细说明了伪赫米特人案。 在 CPU 和 GPU 集群上分析时间和内存利用率。 我们的结果表明,现在处理10^5的密集BSE矩阵是可行的。
准确识别金属有机框架(MOF)的合成条件仍然是材料研究的关键瓶颈,因为科学文本的非结构化和异构性阻碍了将文献衍生的知识转化为可操作的见解。 在这里,我们介绍了MOFh6,一个基于大型语言模型(LLM)的多代理系统,旨在提取,构建和应用来自各种输入格式的合成知识,包括原始文献和晶体代码。 在 gpt-4o-mini 和微调的基础上,使用多达很少的专家注释数据, MOFh6 达到99
电子废物(电子废物)是一个日益严重的全球挑战,由于修复和再利用困难,数百万个功能组件被丢弃。 传统的电路组装依赖于焊接,这会产生半永久性的键,限制组件的回收,并导致不必要的浪费。 我们介绍了ProForm,一种用于无焊电路原型的热成型方法。 通过将电子元件与压力成型热塑性塑料封装在一起,ProForm可实现安全、可逆的安装,而无需焊接或定制机械外壳。 这种方法支持广泛的基板,包括柔性、纸张和非平面电路,便于轻松重复使用、更换和快速原型设计。 我们展示了 ProForm 支持原型实践的多功能性。 我们证明ProFormed电路表现出良好的电气性能和机械稳定性。 虽然出于对可持续电子实践的需求,ProForm比传统焊接具有其他显着优势。
这项研究采用深度学习技术来分割扫描电子显微镜图像,从而对具有相当强度的下层鲶石和钢化马氏体钢中的碳化物沉淀物进行定量分析。 在分割之后,对碳化物进行调查,并在图像数据集中探测其体积百分比,大小分布和方向。 我们的研究结果表明,较低的鲷酸盐和钢化马氏体表现出可比的碳化物体积百分比,尽管在钢化马滕石中碳化物的分布更加均匀。 低鲷酸盐中的碳化物表现出比钢化马滕石更好的对齐趋势,与其他研究人员的观察结果一致。 然而,这两种微观结构都显示出分散的碳化物方向,没有任何可辨别的模式。 低鲷钾和钢化马滕石的纵横比和碳化物尺寸的比较分析揭示了惊人的相似之处。 深度学习模型实现了令人印象深刻的像素化精度为98.0
确保深度学习模型的可信度和稳健性仍然是一个基本挑战,特别是在高风险的科学应用中。 在这项研究中,我们提出了一个称为注意力引导训练的框架,该框架将可解释的人工智能技术与定量评估和特定领域的先验相结合,以指导模型关注。 我们证明,在训练过程中对模型解释的特定反馈可以增强模型的概括能力。 我们验证了我们在数字图像相关数据中的语义裂纹尖端分割任务的方法,这是材料断裂机械表征的关键应用。 通过将模型注意力与物理上有意义的应力场(如威廉姆斯分析解决方案描述的应力场)保持一致,注意力引导训练可确保模型专注于物理相关区域。 这最终导致了改进的概括和更忠实的解释。
我们引入了一个统一的机器学习框架,旨在方便地解决合金微观结构在弹性场的影响下的时间演变。 这种方法允许从短轨迹中同时提取弹性参数,并预测其影响下的进一步微观结构演变。 这通过在晶格不匹配eta的存在下专注于脊柱分解,并通过对相位场模拟提供的地面真相演变和合适的卷积循环神经网络架构的预测进行广泛的比较来证明这一点。 然后,这两个任务可以随后执行到级联框架中。 在广泛的不适应条件下,这里呈现的级联模型准确地预测了eta和完整的对应微观结构演变,同时也在接近脊柱侧形分解的关键条件时。 演示了更大的计算域尺寸和轻度推算误差(在训练过程中比采样时间序列长5倍)的可扩展性。 拟议的框架是一般性的,可以应用于这里作为例子所考虑的具体的原型系统之外。 有趣的是,实验视频可以用来推断未知的外部参数,然后模拟进一步的时间演变。
物理信息神经网络(PINNs)在四阶偏微分方程的误差为10^-3-10^-4,创造了一个感知的精度上限,限制了其在工程应用中的采用。 我们通过欧拉-伯努利波束方程的混合傅里叶神经架构突破这一障碍,实现了前所未有的L2误差1.94×10^-7-a比标准PINN提高了17倍,比传统数值方法好15-500×。 我们的方法协同结合了截断的傅里叶系列捕获主导模态行为与提供自适应剩余校正的深度神经网络。 一项系统谐波优化研究揭示了一个反直觉的发现:正好10个谐波产生最佳性能,其精度灾难性地从10^-7到10^-1超过这个阈值。 双相优化策略(Adam紧随其后的是L-BFGS)和自适应权重平衡实现了稳定的超精确融合。 GPU加速实现实现了低于30分钟的训练,尽管第四阶衍生复杂性。 通过解决从建筑刚性到优化景观的现有方法中的12个关键差距,这项工作表明,通过适当的设计可以实现超精度,为科学计算开辟新的范式,机器学习可以匹配或超过传统的数值方法。