随着进化动力学从理论领域转向应用,算法需要超越简单的模型。 然而,文献中很少有这样的方法。 众所周知,生态和生理因素是现实背景下进化的核心,但考虑到这些因素,这些因素通常会使问题难以适应现有方法。 我们介绍了进化游戏的公式,通过建模作为计算来解释生态学和生理学,并使用它通过强化学习的方法分析定向进化的问题。 这种组合使我们能够在学习控制不断进化的细胞群的算法问题上首次开发出同类结果。 我们证明了在细胞生理学或生态学的先前知识有限的情况下生态进化控制的复杂性,给出了指导进化最一般版本的数学问题的第一个结果,并在人工智能和生物学之间建立了新的联系。
时间解析的单细胞组学数据提供了细胞状态的高通量、全基因组测量,有助于逆向工程支撑细胞命运的过程。 这种技术本质上是破坏性的,只允许对底层随机动力学系统进行横截面测量。 此外,细胞除了改变分子状态外,还可能分裂或死亡。 总的来说,这些是推断现实生物物理模型的重大挑战。 我们提出了一种新的方法,不平衡的概率流推断,解决了生物过程的这个挑战,模拟为随机动力学与增长。 通过利用福克-普朗克方程的拉格朗日公式,我们的方法准确地将远离内在的噪音和增长。 我们通过评估一系列模拟和真实的单细胞RNA-seq数据集来展示我们方法的适用性。 与几种现有方法相比,我们发现我们的方法在享受简单的两步训练方案的同时,实现了更高的精度。
Fast Ewald summation是计算分子动力学(MD)模拟中远程库仑相互作用的最广泛使用的方法。 虽然渐近扩展几乎是最优的,但它在并行架构上的性能被底层快速傅里叶变换(FFT)所需的全球通信所主导。 在这里,我们开发了一种新颖的方法,ESP - Ewald与按比例球形波函数(PSWF)的总结 - 为了固定精度,通过PSWF执行Ewald分裂来大幅减少这种变换的大小。 此外,PSWF将传播和插值步骤的成本降至最低,这些步骤在粒子和底层均匀网格之间移动信息。 我们已经将ESP方法集成到两个广泛使用的开源MD包中:LAMMPS和GROMACS。 详细的基准测试表明,这降低了计算远场静电相互作用的成本,从而在核心数量方面实现了更好的强扩展。 使用超过一千个内核时,总执行时间减少了2到3倍,即使在优化调整本机代码中现有的内部参数之后。 我们在真实的长期生物模拟中验证加速代码。
越来越多的证据表明,大脑中的突触权重遵循重尾分布,但大多数对循环神经网络(RNN)的理论分析都假设高斯连接性。 我们系统地研究RNN的活动,随机权重来自生物学上合理的Lévyα稳定分布。 虽然无限系统的均场理论预测静止状态总是不稳定的 - 意味着无处不在的混乱 - 我们的有限大小分析揭示了静止和混沌动力学之间的急剧过渡。 我们理论上预测系统从静止到混沌动力学的增益,并通过模拟验证它。 与高斯网络相比,重尾RNN在混沌边缘附近表现出更广泛的参数机制,即向混沌的缓慢过渡。 然而,这种稳健性伴随着权衡:较重的尾部降低了吸引子的Lyapunov尺寸,表明有效尺寸较低。 我们的研究结果揭示了在混乱边缘附近的动态稳健性与高维神经活动的丰富性之间的生物学对齐权衡。 通过分析表征有限大小网络中的过渡点 - 平均场理论崩溃 - 我们提供了一个可操作的框架,用于理解现实大小,重尾神经回路中的动力学。
鸟类和蝙蝠是极其熟练的传单:无论是在狩猎猎物中,还是在躲避捕食者中,后静止机动性都是至关重要的特征。 在这方面,它们的性能大大超过了类似规模的无人飞行器(UAV)。 在无人机中实现后期可操作性或超机动性的尝试通常侧重于推力矢量技术。 在这里,我们展示了仿生翼变形为古典超机动性提供了额外的途径,以及生物启发的后支架机动性的新形式。 使用最先进的飞行模拟器,配备升降表面运动多体模型和用于所有起重表面的延时微分方程(Goman-Khrabrov)动态失速模型,我们展示了用于两个后档机动的仿生变形翼无人机的能力:经典的快速鼻指向和射击(RaNPAS)机动;以及由墙壁着陆机动。 我们开发一种针对这些操作的指导方法,基于非线性纵向稳定性剖面的参数变化,该模型允许在这些类型的无人机中有效地探索后失速机动的空间;并深入了解有效的变形运动学,以实现这些机动。 我们的研究结果证明了仿生变形的能力,以及非线性纵向稳定性的变形控制,使无人机中的超机动性先进形式成为可能。
生物医学应用,如靶向药物输送,显微手术和传感,依赖于以微创的方式到达体内的精确区域。 人造细菌鞭毛(ABFs)已成为这项任务的潜在工具,通过外部磁场的帮助下通过循环系统进行导航。 虽然它们的游泳特性在简单的设置中很好理解,但由于血液流动的复杂性和详细模拟的高计算成本,他们通过逼真的毛细血管网络进行控制的导航仍然是一个重大挑战。 我们通过在外部磁场推动的视网膜毛细血管中ABF进行数值模拟来应对这一挑战。 模拟基于一个经过验证的血液模型,该模型预测单个红细胞的动力学及其与ABF的流体动力学相互作用。 磁场遵循控制策略,将ABF带到规定的目标。 控制策略是通过一个演员-批评的,策略外强化学习算法,再加上系统的精简顺序模型来学习。 我们表明,同样的政策有力地引导ABF达到规定的目标,在减少顺序模型和细粒度的血液模拟。 这种方法适用于以适度的计算成本为个性化医疗设计稳健的控制策略。
复杂性科学为量化不可预测性、结构和信息提供了广泛的措施。 然而,这些措施的系统性概念组织仍然缺失。 我们提出了一个统一的框架,该框架沿着三个轴(规律性,随机性和复杂性)定位统计,算法和动力学度量,并将它们定位在一个共同的概念空间中。 我们将统计、算法和动态度量映射到这个概念空间中,讨论它们的计算可访问性和可近似性。 该分类法揭示了不计算性带来的深刻挑战,并突出了现代数据驱动方法(包括自动编码器,潜在动态模型,符号回归和物理信息神经网络)的出现,作为经典复杂性理想的务实近似。 潜伏空间成为具有规律性提取、噪声管理和结构化压缩的可操作领域,通过高维系统中的实际建模来弥合理论基础。 最后,我们概述了复杂物理系统中对物理知识的人工智能和人工智能引导发现的影响,认为经典的复杂性问题仍然是下一代科学建模的核心。
这项工作提出了一种新的不拟合的有限元框架,以模拟时间依赖域中的耦合表面散积问题,重点关注肌酐皮层和细胞质之间动物细胞中的流体-流体相互作用。 皮层是等离子膜下面的薄层,通过产生类似于张力的表面收缩力来提供结构完整性并推动形状变化。 皮质收缩产生Marangoni样表面流动并诱导细胞内细胞质流动,这些流动对于细胞分裂,迁移和极化等过程至关重要,特别是在大型动物细胞中。 尽管其重要性,皮质细胞质相互作用的时空调控仍然知之甚少,计算建模可能非常具有挑战性,因为表面散积动力学通常会导致大细胞变形。 为了应对这些挑战,我们提出了一个锐利的界面框架,该框架将用于表面流动的微量有限元方法与用于散装流动的聚合有限元方法独特地结合在一起。 这种方法可以在固定笛卡尔网格上实现精确和稳定的模拟,而无需重新网格化。 该模型还通过活性张力分子调节器的表面运输来融合机械化学反馈。 我们使用基于水平集的方法来跟踪不断变化的表面,在固定的笛卡尔网格上解决由此产生的混合维系统。 数字实验验证了该方法的准确性和稳定性,捕获了自组织模式形成,曲率驱动的放松和细胞裂解等现象。 这个新框架为研究动物细胞中日益复杂的形态遗传过程提供了一个强大而可扩展的工具。
生物细胞可以在其直接环境中释放化合物,通常不均匀地超过其细胞膜,之后化合物通过扩散扩散传播。 在数学建模和模拟这些细胞的集体中,用点源取代空间扩展细胞在理论上和数值上是有利的,特别是在细胞数大,但仍然如此之小,以至于连续密度描述不能证明是合理的,或者当细胞移动时。 我们表明,细胞边界上的不均匀通量密度可以通过点源方法实现,从而通过使用多个聚类点源(和汇)来保持计算效率。 在这份报告中,我们把自己限制在空间排除模型中作为通量密度的正弦函数,我们展示了如何在点源模型中确定狄拉克三角洲点的振幅,这样点源模型和空间排除模型之间的偏差就很小。
单细胞生物和各种细胞类型在遵循化学梯度时使用一系列运动模式,但目前尚不清楚哪种模式最适合不同的梯度。 在这里,我们将化学类分子细胞的方向决策建模为刺激依赖肌动蛋白招募比赛。 从细胞体延伸的假蚕类动物争夺一个有限运动池,将细胞推向它们的方向,直到一个伪豆荚获胜并确定运动方向。 我们的最小模型提供了对细胞用于达到精确化学轴的物理极限的策略的定量理解,与数据对齐,而无需显式梯度传感或细胞记忆的持久性。 为了推广我们的模型,我们使用强化学习优化来研究伪豆荚抑制的效果,这是一种简单但有效的细胞算法,通过该算法,细胞可以抑制可能的运动方向。 不同的基于伪豆荚的化学轴策略自然出现,取决于环境及其动力学。 例如,在静态梯度中,细胞可以以伪豆荚精度为代价更快地反应,这在嘈杂的浅梯度中特别有用,因为它矛盾地增加了化学精度。 相比之下,在动力学梯度中,细胞形成新伪豆荚。 总体而言,我们的工作展示了机械智能,以实现高化学轴性能,具有最小的细胞调节。
机器学习在计算化学和材料科学中起着越来越重要的作用,补充了计算密集型的 ab 初始和第一原则方法。 尽管它们很实用,但机器学习模型在原子模拟过程中往往缺乏概括能力和稳健性,产生了非物理能量和力量预测,阻碍了他们的实际应用。 我们通过引入一种物理知识,弱监督的方法来训练机器学习的原子间电位(MLIP)来应对这一挑战。 我们引入了两种新颖的损失函数,通过泰勒扩展和使用保守力量的概念来推断潜在的能量。 我们的方法提高了MLIP应用于训练任务的准确性,并减少了对具有大型数据集的预训练计算要求模型的需求。 特别是,我们进行了广泛的实验,展示了各种基线模型和基准数据集的能量和力误差(通常降低2倍)。 此外,我们在MD模拟MLIP模型时证明了改进的鲁棒性,该模型接受了提议的弱监督损失的训练。 最后,我们的方法改进了基础模型对稀疏、高度准确的 ab initio 数据进行微调。 我们执行实验的方法和脚本的实现可在https://github.com/nec-research/PICPS-ML4Sci上找到。
我们介绍了随机连接的神经群的模型,并通过动态均场理论和模拟来研究其动力学。 我们的分析揭示了一个丰富的相位图,以高和低维混沌相位为特征,由最大Lyapunov指数和参与比维度的低值特征的交叉区域分开,但Lyapunov维度的高值在整个地区发生重大变化。 与直觉相反,可以通过将噪声添加到强大的模块化连接中或通过将模块化引入随机连接来减少混乱。 将模型扩展到包括多层次,分层连接表明,跨级别活动之间的松散平衡使系统走向混乱的边缘。
T细胞受体(TCR)与其配体之间的生物物理相互作用决定了细胞免疫反应的特异性。 然而,受体和配体的巨大多样性使得在不同配体创造的不同结合亲和力景观中发现可推广的规则具有挑战性。 在这里,我们提出了一个优化框架,用于发现生物物理规则,预测TCR是否与配体具有特异性。 将这个框架应用于与SARS-CoV-2肽集合相关的TCR,我们系统地表征了共同特异性如何取决于受体之间氨基酸差异的类型和位置。 我们还证明,推断的规则泛化为配体,与训练期间看到的任何配体非常不同。 我们的分析表明,替代氨基酸之间的无菌特性的匹配对于受体共特异性红比显著确定进化可替代性的疏水性更重要。 我们的分析还量化了不直接接触肽的位置对于特异性的重要性。 这些发现强调了数据驱动方法的潜力,以揭示支撑适应性免疫反应特异性的分子机制。
随机系统跨越不同领域,表现出从分子动力学到气候现象等过程的波动。 Langevin方程是研究这些系统的通用数学模型,能够预测它们的时间演变和对热力学量的分析,包括吸收的热量,在系统上完成的工作和熵生产。 然而,从观察到的轨迹中推断Langevin方程是一个具有挑战性的问题,评估与推断方程相关的不确定性尚未完成。 在这项研究中,我们提出了一个全面的框架,该框架使用贝叶斯神经网络在过度和不足的系统中推断Langevin方程。 我们的框架首先分别提供漂移力和扩散矩阵,然后将它们组合在一起构造朗格文方程。 通过提供预测的分布而不是单个值,我们的方法使我们能够评估预测的不确定性,这有助于防止潜在的误解和对系统的错误决策。 我们展示了我们的框架在为各种场景(包括神经元模型和微观引擎)推断Langevin方程的有效性,突出了其多功能性和潜在影响。
单点突变后蛋白质稳定性变化的预测在计算生物学中起着关键作用,特别是在药物发现,酶再造和遗传疾病分析等领域。 虽然深度学习战略推动了这一领域的发展,但由于资源需求,这些策略在标准工作流程中的使用仍然有限。 相反,类似潜力的方法是快速、直观和高效的。 然而,这些通常估计吉布斯自由能量的变化而不考虑展开的蛋白质状态中的自由能量变化,这种遗漏可能会破坏质量平衡并降低准确性。 这项研究表明,将质量平衡校正(MBC)纳入解释展开的状态显着增强了这些方法。 虽然许多机器学习模型部分地模拟了这种平衡,但我们的分析表明,对展开状态的精细表示可能会提高预测性能。
了解生物系统的动态性质是破译细胞行为、发育过程和疾病进展的基础。 单细胞RNA测序(scRNA-seq)提供了基因表达的静态快照,在单个时间点对细胞状态提供了有价值的见解。 最近的时间解决scRNA-seq,空间转录组学(ST)和时间序列空间转录组学(temporal-ST)的进步进一步彻底改变了我们研究单个细胞时空动力学的能力。 这些技术与马尔可夫链、随机微分方程(SDE)和生成模型(如最优运输和薛定谔桥)等计算框架相结合,可以重建动态细胞轨迹和细胞命运决策。 本综述讨论了这些动态系统方法如何为从系统角度建模和推断细胞动力学提供新机会。
小分子药物发现的生成式机器学习模型已经显示出巨大的前景,但它们产生的许多分子太难合成,使它们对进一步的研究或开发变得不切实际。 在这项工作中,我们提出了一种新的方法,通过微调Meta的Llama3大型语言模型(LLM)来创建SynLlama,它生成由通常可访问的构建块和健壮的有机反应模板组成的全合成路径。 与其他最先进的方法相比,SynLlama使用更少的数据探索了一个大的合成空间,并在自下而上的合成,可合成模拟生成和命中扩展方面提供了强大的性能,为药物化学家提供了药物发现开发的宝贵工具。 我们发现,SynLlama即使没有外部积木的训练,也可以有效地推广到看不见的可购买积木,这意味着它的重建能力延伸到比训练数据更广泛的可合成化学空间。 我们还演示了SynLlama在制药环境中用于模拟分子的合成规划,并为目标蛋白的拟议抑制剂击中膨胀引线。
我们提出了基于动态系统的新老化理论,并提供了一种数据驱动的计算方法来量化细胞水平上的变化。 我们使用ergodic理论来分解衰老过程中变化的动力学,并表明衰老从根本上说是生物系统内的一个耗散过程,类似于由于非保守力而发生耗散的动力学系统。 为了量化耗散动力学,我们使用基于变压器的机器学习算法来分析基因表达数据,将年龄作为代币,以评估与年龄相关的耗散如何反映在嵌入空间中。 通过评估基因和年龄嵌入的动力学,我们提供了一个细胞老化图(CAM),并确定了指示各种组织和细胞类型在衰老过程中的基因嵌入空间,非线性过渡和熵变异的发散模式。 我们的结果提供了一个新颖的老化视角作为一个耗散过程,并引入了一个计算框架,能够测量与年龄相关的变化与分子分辨率。
物理信息神经网络(PINN)通过将管理的物理定律集成到神经网络的架构中来模拟系统的动力学。 通过将物理定律作为约束,PINN克服了数据疤痕和潜在高维度的挑战。 现有的PINN框架依赖于完全观察到的时间过程数据,许多系统的获取可能令人望而却步。 在这项研究中,我们开发了一种新的PINN学习范式,即Constrained Learning,它允许使用非时间课程或部分观察数据近似一阶衍生物或运动。 计算原理和约束学习的一般数学公式被开发出来。 我们进一步引入了MPOCtrL(基于消息传递优化的Constrained Learning)一种针对Constrained Learning框架量身定制的优化方法,旨在平衡物理模型和观察数据的拟合。 它的代码可在 github 链接:https : / /github.com/ptdang1001/MPOCtrL 合成和真实世界数据的实验表明,MPOCtrL 可以有效地检测观察到的数据与系统底层物理属性之间的非线性依赖。 特别是,在代谢通量分析的任务上,MPOCtrL优于所有现有的数据驱动通量估计器。
No more items to load.