定量生物学
Quantitative Biology
生物分子
Biomolecules
细胞行为
Cell Behavior
基因组学
Genomics
生物膜是一种独立的细菌群落,它使用称为自导体(AIs)的信号分子,通过法定人数传感过程协调反应。 生物膜具有双重作用,既能对抗抗菌素耐药(AMR),又利用其在生物加工中的潜力,因为它们的产品具有商业潜力。 以前的工作已经证明了一些生物膜中独特的各向异性通道几何如何影响AIs的传播。 本文中,将2D各向异生物膜通道模型扩展为时间变化通道(TVC),以表示水通道发展时成熟阶段的扩散动力学。 由于成熟与各向异性的发展有关,时间变化模型捕获了从各向异性扩散到各向异性扩散的转变。 基于粒子的模拟结果说明了 TVC 是如何结合各向异性和各向异性扩散的传播特征的混合场景的。 这种混合行为与生物膜成熟度相一致。 TVC的进一步研究包括对相互信息(MI)的表征,该特征表明,增加的AI计数,减少的发射器 - 接收器距离,更大程度的各向异性,以及更短的符号间干扰长度增加了MI。 最后,简短的尺寸分析演示了各向异通道结果对较大生物膜和时间尺度的可扩展性。
我们开发了一个模型,人类间充质干细胞(hMSCs)和球粒细胞在无纺布聚乙二醛酸酯(PET)支架中进化,浸渍含透明质,并配有分化介质。 支架和细胞被假定包含在具有液体灌注的生物反应器中。 hMSCs分化为球粒细胞有利于细胞外基质(ECM)的产生,并受到流体应力的影响。 该模型考虑了ECM和PET支架的变形。 支架结构通过CT图像纤维分布的统计评估明确包含。 有效的宏观方程是通过从较低(微观和中镜)尺度上的动力学进行适当的升级获得的,并且在运动术语中具有编码评估的各向各性支架结构的显式细胞扩散张量。 数值模拟显示了它对整体细胞和组织动力学的影响。
反向强化学习(IRL)是一种强大的范式,用于揭示驱动代理行为的激励结构,通过在马尔可夫决策过程(MDP)中从观察到的轨迹中推断出未知的奖励函数。 然而,大多数现有的IRL方法都需要访问过渡函数,无论是规定还是先验估计,当底层动力学未知,不可观察或不容易采样时,这会带来重大挑战。 我们提出了Fokker-Planck逆强化学习(FP-IRL),这是一个新颖的物理约束IRL框架,专为受福克-普朗克(FP)动力学管理的系统而设计。 FP-IRL同时直接从轨迹数据中推断奖励和过渡功能,而无需访问采样过渡。 我们的方法利用了MDP和FP方程之间的猜想等价物,将MDP中的奖励最大化与FP动力学中的自由能量最小化联系起来。 这种连接可以使用我们的变异系统识别推理方法推断潜在的功能,从中可以使用分析表达式恢复全套MDP组件 - 奖励,过渡和政策。 我们通过合成基准实验和山地车问题的修改版本证明了FP-IRL的有效性。 我们的结果表明,FP-IRL实现了精确恢复代理激励,同时保持计算效率和物理可解释性。
物理信息神经网络(PINNs)是神经网络,它将微分方程建模的动力学系统的定律嵌入到它们的损失函数中作为约束。 在这项工作中,我们提出了一个应用于肿瘤学的PINN框架。 在这里,我们寻求学习由于肿瘤微环境中的组合治疗而导致的时间变化相互作用。 在肿瘤学中,实验数据往往稀疏,由肿瘤体积的几个时间点组成。 通过嵌入来自先前关于动力学系统的信息的归纳偏差,我们扩展了物理信息神经网络(PINN),并将观察到的生物约束作为正则化因子。 修改后的PINN算法能够引导自己找到合理的解决方案,并且只需几个训练示例就可以很好地推广。 我们通过学习在组合疗法的普通微分方程(ODE)模型中间歇性应用的治疗动力学来证明我们方法的优点。 该算法为一些ODE模型参数的ODE和时间变化形式提供了解决方案。 我们使用诸如均平方误差(MSE)、均绝对误差(MAE)和均绝对百分率误差(MAPE)等指标展示了强大的收敛性。
大型语言模型(LLMs)正在通过开发“虚拟细胞”来改变细胞生物学 - 计算系统,这些系统代表,预测和推理细胞状态和行为。 这项工作提供了用于虚拟细胞建模的LLM的全面审查。 我们提出了一个统一的分类法,将现有方法组织成两个范式:LLM作为Oracle,用于直接蜂窝建模,LLM作为代理,用于编排复杂的科学任务。 我们确定了三个核心任务 - 细胞表征,扰动预测和基因调控推理 - 并审查其相关模型,数据集,评估基准以及可扩展性,可推广性和可解释性方面的关键挑战。
细胞分化的动力学模型是推进对与这一过程相关的疾病的理解和治疗(如癌症)的基础。 随着单细胞数据集的快速增长,这也成为机器学习特别有前途的活跃领域。 然而,目前最先进的模型依赖于计算昂贵的最佳传输预处理和多阶段训练,同时也没有发现明确的基因相互作用。 为了应对这些挑战,我们提出了Cell-Mechanistic Neural Networks(Cell-MNN),这是一种编码器解码器架构,其潜在表示是一种局部线性化的ODE,可以控制细胞从茎到组织细胞的动力学。 Cell-MNN是完全端到端的(除了标准的PCA预处理),其ODE表示明确学习生物学上一致和可解释的基因相互作用。 经验上,我们表明Cell-MNN在单细胞基准测试中实现了竞争表现,在扩展到更大的数据集和跨多个数据集的联合训练方面超过了最先进的基线,同时还学习了可解释的基因相互作用,我们根据TRRUST基因相互作用数据库进行了验证。
预测细胞对遗传扰动的反应是系统生物学的一个基本挑战,对于推进治疗发现和虚拟细胞建模至关重要。 虽然大型语言模型(LLM)显示出生物推理的前景,但由于在适应结构化实验数据方面的挑战,它们应用于扰动预测仍然没有得到探索。 我们介绍了SynthPert,这是一种新颖的方法,通过对前沿模型产生的合成推理痕迹进行监督微调来增强LLM性能。 使用PerturbQA基准测试,我们证明我们的方法不仅实现了最先进的性能,而且超越了产生训练数据的前沿模型的能力。 我们的研究结果揭示了三个关键见解:(1)合成推理痕迹即使在部分不准确的情况下也能有效地提炼生物知识,(2)这种方法使跨细胞型泛化与87
计算模型为癌症进化等复杂的生物学过程提供了重要的见解,但它们的机械性质往往使它们成为非线性和参数丰富的,复杂的校准。 我们使用贝叶斯校准在四种互补策略中系统地评估细胞迁移模型中的参数概率分布:参数化和代理模型,每种模型都有并且没有明确的模型差异。 这种方法能够联合分析参数不确定性、预测性能和可解释性。 应用于微流体设备胶质母细胞瘤进展的真实数据实验,代理模型实现了更高的计算效率和预测准确性,而参数模型由于其机械性接地而产生更可靠的参数估计。 纳入模型差异暴露结构局限性,明确模型完善的地方。 这些比较共同为校准和改进复杂生物系统的计算模型提供了实际指导。
本文介绍了一种新的显微镜图像分析框架,专为配备标准CPU桌面的低预算实验室设计。 基于Python的程序通过先进的计算机视觉和机器学习管道,对培养中的活细胞进行细胞学分析。 至关重要的是,该框架在无标签数据上运行,无需手动注释的训练数据或训练阶段。 它可以通过用户友好的跨平台GUI访问,无需编程技能,同时还为开发人员的编程控制和集成提供了脚本界面。 端到端工作流执行语义和实例分割、特征提取、分析、评估和自动化报告生成。 其模块化架构支持轻松维护和灵活的集成,同时支持单图像和批处理。 该框架在活细胞公共数据集中验证了几种未染色的细胞类型,与Cellpose和StarDist等当代工具相比,该框架展示了卓越的准确性和可重复性。 它在基于CPU的平台上的竞争分割速度突出了其在基础研究和临床应用方面的巨大潜力 - 特别是在用于个性化医学和肌肉再生疗法的细胞移植方面。
人类语言是传达意图的最富有表现力的工具之一,但大多数人工或生物系统缺乏解释或有意义地回应它的机制。 缩小这一差距可以使对复杂、分散的系统进行更自然的控制形式。 在人工智能和人工生活中,最近的工作探讨了语言如何指定高级目标,但大多数系统仍然依赖于工程奖励,特定任务的监督或严格的命令集,将泛化限制在新颖的指令中。 类似的限制也适用于合成生物学和生物工程,其中控制中心通常是基因组而不是环境扰动。 一个悬而未决的关键问题是,人工或生物集体是否可以仅用自由形式的自然语言来指导,而无需特定任务的调整或精心设计的评估指标。 我们在这里提供了一个可能的答案,首次展示了简单代理的集体行为可以通过自由形式语言提示来指导:一个AI模型将一个命令提示转换为应用于模拟细胞的干预措施;第二个AI模型对提示如何很好地描述生成的细胞动力学进行评分;而以前的AI模型被进化以提高后者产生的分数。 与以前的工作不同,我们的方法不需要工程健身功能或特定领域的提示设计。 我们表明,进化的系统在没有再训练的情况下推广到看不见的提示。 通过将自然语言视为控制层,该系统提出了一个未来,其中口语或书面提示可以将计算,机器人或生物系统引导到所需的行为。 这项工作为人工智能生物学伙伴关系的愿景提供了一个具体的步骤,其中语言取代了数学目标函数,固定规则和特定领域的编程。
微生物群是人体的重要组成部分,从事食物消化和免疫防御等任务。 必须了解它们的结构和功能,以促进宿主健康并促进疾病期间的迅速恢复。 由于在原地实验研究这些系统的困难,在数学建模领域正在进行更多的研究。 可视化时空数据具有挑战性,目前模拟微生物群落时空发展的工具通常只提供有限的功能,通常需要专业知识才能产生有用的结果。 为了克服这些限制,我们提供了一个用户友好的工具,交互式地探索时空模拟数据,称为MicroLabVR,它将空间数据传输到虚拟现实(VR),同时遵循增强用户体验(UX)的指导方针。 使用MicroLabVR,用户可以导入包含人口增长、物质浓度发展和代谢通量分布数据的CSV数据集。 实现的可视化方法允许用户在VR环境中交互式地评估数据集。 MicroLabVR旨在通过在其空间环境中探索微生物组数据来改善用户的数据分析。
单细胞多组学数据包含细胞状态的巨大信息,分析这些数据可以揭示细胞异质性、疾病和生物过程的宝贵见解。 然而,由于细胞分化和发育是一个持续和动态的过程,因此对基于单细胞多组学数据的计算建模和推断细胞相互作用模式仍然具有挑战性。 本文介绍了基于组学内部和组学间对比学习的新型单细胞多组学融合框架s scI2CL,用于从各种下游任务的互补多组学数据中学习全面和歧视性的细胞表征。 对四个下游任务进行的广泛实验验证了 scI2CL 的有效性及其优于现有同行的优势。 在细胞聚类中,scI2CL在四个广泛使用的真实世界数据集上超越了8种最先进的方法。 在细胞亚型中,scI2CL有效地区分了三种潜在的单核细胞亚群,这些亚群不是通过现有方法发现的。 同时,scI2CL是唯一正确构建细胞发育轨迹的方法,从造血干细胞和祖细胞到记忆B细胞。 此外,scI2CL解决了CD4 + T细胞的两个亚群之间的细胞类型错误分类,而现有方法未能精确区分混合细胞。 总之,scI2CL可以准确地表征细胞之间的交叉组学关系,从而有效地融合多组学数据,并学习判别细胞表征,以支持各种下游分析任务。
了解生物发育背后的规则是生物学中的一个主要未解决的问题。 发育中的生物体中的每个细胞通过分裂,排泄,消耗或重组来响应其局部环境中的信号,但这些个体行为如何在宏观数量的细胞中协调以生长具有精致功能的复杂结构尚不清楚。 在这里,我们使用自动分化的最新进展来发现局部相互作用规则和遗传网络,这些规则和遗传网络在开发模型中产生新兴的系统级特征。 我们考虑生长的组织与细胞相互作用介导由形态素扩散,细胞粘附和机械应力介导。 每个细胞都有一个内部遗传网络,用于根据细胞的局部环境做出决定。 我们表明,人们可以通过解释性遗传网络的形式学习控制细胞相互作用的参数,用于复杂的发育场景,包括定向轴向伸长,通过化学信号通过化学信号进行细胞类型稳态,以及通过机械应力生长的同质化。 当结合最近测量生长组织中细胞时空动力学和细胞基因表达的实验进展时,这里概述的方法为解开细胞发育基础提供了一条有希望的途径。
细胞分裂过程中新细胞壁的定位对植物组织结构的形成起着关键作用。细胞几何形状对分裂面定位的影响已被先前研究归纳为各种几何规则。因此,将细胞形状与分裂方向联系起来,通常需要比较观察到的分裂模式与特定规则下的预测结果。这种假设驱动方法的一个根本局限是需要先验定义待测试的规则。作为替代方案,我们提出了一种基于数据的方法来研究细胞几何形状与分裂面定位之间的关系,利用深度神经网络在多维空间中学习复杂关系的能力。采用基于图像的细胞表示方法,我们展示了如何使用改进的UNet架构(适用于细胞掩模操作)从母细胞几何形状中学习和预测分裂模式。通过使用合成数据和拟南芥胚胎细胞,我们在各种不同的细胞形状和分裂模式上评估了模型性能。研究发现,训练后的模型能够解释先前在现有几何规则下无法统一的胚胎分裂模式。我们的工作展示了深度网络在理解细胞分裂模式和生成关于细胞分裂定位控制的新假设方面的潜力。
背景:体外内皮细胞培养被广泛用于研究血管生成。 细胞网络组织微缩图像通常被手动分析,这一过程耗时且主观。 像ImageJ(NIH)这样的自动化工具可以提供帮助,但通常很慢且不准确。 此外,随着内皮网络变得越来越复杂,传统的架构指标可能无法完全反映网络成熟度。 为了解决这些限制,我们开发了 tubuleTracker,一个快速、客观地量化内皮网络架构和成熟度的软件工具。 方法:人类脐静脉内皮细胞在细胞外基质中培养,54张图像使用相位对比显微镜获得。 每张图片由三位独立审稿人以及ImageJ和tuleTracker手动分析。 关键指标包括小管计数、总长度、节点计数、小管面积和容器循环。 同时,训练有素的科学家对每幅图像的血管生成成熟度进行了1-5级(1=最成熟)的评分。 结果:每张图片的分析时间差异很大:手动(8分钟),ImageJ(58 + / 4 s)和块状Tracker(6 + /-2)(p<0.0001)。 在小管计数(手动 168+/-SD、小管Tracker 92+/-SD、ImageJ 433+/-SD)、长度和节点计数(所有 p<0.0001)中也存在显著差异。 管状跟踪器的指标在血管生成成熟度得分(包括小管计数、长度、节点计数、面积和循环度(所有 p<0.0001)中差异很大。 结论: tuleTracker 比基于手动和 ImageJ 的分析更快、更一致。 事实证明,容器循环性在捕获血管生成成熟方面特别有效。 tubuleTracker作为生物医学研究界的免费共享软件提供。
生物图像分析传统上侧重于测量细胞或其他实体感兴趣的特定视觉特性。 获得越来越大吸引力的补充范式是基于图像的剖析 - 量化许多不同的视觉特征,以形成全面的配置文件,可以揭示细胞状态,药物反应和疾病机制中的隐藏模式。 虽然CellProfiler等现有工具可以生成这些功能集,但它们对自动化和可重复分析构成了重大障碍,阻碍了机器学习工作流程。 这里我们介绍了 cp_measure,一个 Python 库,它将 CellProfiler 的核心测量功能提取到用于程序化特征提取的模块化 API 优先工具中。 我们证明 cp_measure 功能与 CellProfiler 特性保持高保真度,同时实现与科学 Python 生态系统的无缝集成。 通过3D星形胶质细胞成像和空间转录组学的应用,我们展示了cp_measure如何实现可重复的、基于图像的自动分析管道,这些管道可以有效地扩展用于计算生物学中的机器学习应用。
单细胞多组学技术的出现使单个细胞内不同组学层同时进行了分析。 整合此类多模态数据为细胞身份、调控过程和疾病机制提供了前所未有的见解。 然而,它仍然具有挑战性,因为当前的方法通常依赖于在预处理过程中选择高度可变的基因或峰值,这可能会无意中丢弃关键的生物信息。 在这里,我们介绍了scMamba,一个基础模型,旨在集成单细胞多组学数据,而无需事先选择特征,同时保留基因组位置信息。scMamba引入了基于补丁的细胞标记化策略,将基因组学区域视为单词(令牌)和细胞作为句子。 基于国家空间二元性的概念,scMamba从高维,稀疏的单细胞多组学数据中提炼出丰富的生物学见解。 此外,我们新颖的对比式学习方法,通过余氨酸相似性正则化增强,与传统方法相比,在组学层之间实现卓越的对齐。 跨多个数据集的系统基准测试表明,scMamba在保存生物变异,对齐组学层以及增强关键下游任务(如聚类,细胞类型注释和轨迹推理)方面明显优于最先进的方法。 我们的发现将scMamba定位为大规模单细胞多组学整合的强大工具,能够处理大规模地图集并推动生物发现。
生成高保真和生物学上合理的合成单细胞RNA测序(scRNA-seq)数据,特别是有条件控制,由于其高维度,易变性和复杂的生物变异,具有挑战性。 现有的生成模型通常难以捕捉这些独特的特性,并确保蜂窝网络中结构噪声的坚固性。 我们介绍了LapDDPM,一种新颖的有条件图形扩散概率模型,用于健壮和高保真scRNA-seq生成。 LapDDPM独特地将基于图形的表示与基于分数的扩散模型集成,并通过图形边缘权重上的新型光谱对抗扰动机制增强。 我们的贡献是三重的:我们利用拉普拉西亚位置编码(LPE)来丰富潜在的空间,使用关键的细胞关系信息;我们开发了一个基于条件的基于分数的扩散模型,用于从复杂的scRNA-seq分布中有效地学习和生成;我们采用了独特的光谱对抗训练方案,提高了对结构变化的鲁棒性。 对各种scRNA-seq数据集进行的广泛实验证明了LapDDPM的卓越性能,实现了高保真度并生成了生物学上合理的细胞类型特异性样品。 LapDDPM为条件scRNA-seq数据生成设定了新的基准,为各种下游生物应用提供了强大的工具。
单细胞转录组学已成为数据驱动的生物学洞察的重要来源,使使用先进的深度学习方法能够在单细胞水平上理解细胞异质性和转录调节。 随着空间转录组学数据的出现,我们有在组织环境中学习细胞的承诺,因为它提供了空间坐标和转录组学读数。 然而,现有的模型要么忽略了空间分辨率或基因调控信息。 细胞中的基因调控可能会根据邻近细胞的微环境线索而改变,但现有模型忽略了基因调控模式,具有跨越抽象层面的分层依赖性。 为了从空间转录组学数据中创建细胞和基因的上下文化表示,我们引入了HEIST,一个基于空间转录组学和蛋白质组学数据的分层图形变压器基础模型。 HEIST将组织建模为空间细胞邻域图,每个细胞反过来被建模为基因调控网络图。 该框架包括一个分层图形变压器,执行跨级别消息传递和消息在级别内传递。 HEIST对来自15个器官的124个组织的22.3M细胞进行了预训练,使用空间感知的对比学习和蒙面的自动编码目标。 对HEIST细胞表征的无监督分析表明,它有效地编码了细胞嵌入中的微环境影响,从而发现了先前模型无法区分的空间信息亚群。 此外,HEIST在四项下游任务上取得了最先进的结果,如临床结果预测,细胞类型注释,基因归因和跨多种技术的空间知情细胞聚类,突出了分层建模和基于GRN的表征的重要性。
我们派生并模拟了一个与Rho GTPase信号通路相关的机械转导的数学模型。 该模型解决了信号过程和细胞力学之间的双向耦合。 提出了一种基于散积表面有限元素的数值方法,用于近似非线性反应扩散方程的耦合系统,在细胞内部和细胞膜上定义,以及弹性方程。 我们的模拟结果说明了新的新兴特征,如动力学对细胞形状的强烈依赖,对基底刚度变化的阈值状反应,以及耦合力学和信号传导可能导致细胞变形的稳健性,导致基板刚度的更大变化,确保机械稳态与实验一致。
继续滚动加载更多