最近的研究已经证明了将单细胞数据建模为自然语言的可行性,以及利用强大的大型语言模型(LLM)来理解细胞生物学的潜力。 然而,对LLM在语言驱动的单细胞分析任务上的表现的全面评估仍未得到探索。 受这一挑战的激励,我们引入了CellVerse,这是一个统一的以语言为中心的问答基准,该基准整合了四种类型的单细胞多组学数据,并包括三个分层水平的单细胞分析任务:细胞类型注释(细胞水平),药物反应预测(药物水平)和扰动分析(基因水平)。 超越这一点,我们系统地评估CellVerse上14个开源和闭源LLM的性能,从160M到671B。 值得注意的是,实验结果表明:(1)现有的专业模型(C2S-Pythia)未能在CellVerse的所有子任务中做出合理的决策,而Qwen,Llama,GPT和DeepSeek家族模型等通才模型在细胞生物学领域表现出初步的理解能力。 (2)当前LLM的性能达不到预期,具有很大的改进空间。 值得注意的是,在广泛研究的药物反应预测任务中,没有一个被评估的LLM比随机猜测表现出显着的性能改善。 CellVerse提供了第一个大规模的经验证明,在将LLM应用于细胞生物学方面仍然存在重大挑战。 通过引入CellVerse,我们通过自然语言为推进细胞生物学奠定了基础,并希望这种范式能够促进下一代单细胞分析。
单细胞生物和各种细胞类型在遵循化学梯度时使用一系列运动模式,但目前尚不清楚哪种模式最适合不同的梯度。 在这里,我们将化学类分子细胞的方向决策建模为刺激依赖肌动蛋白招募比赛。 从细胞体延伸的假蚕类动物争夺一个有限运动池,将细胞推向它们的方向,直到一个伪豆荚获胜并确定运动方向。 我们的最小模型提供了对细胞用于达到精确化学轴的物理极限的策略的定量理解,与数据对齐,而无需显式梯度传感或细胞记忆的持久性。 为了推广我们的模型,我们使用强化学习优化来研究伪豆荚抑制的效果,这是一种简单但有效的细胞算法,通过该算法,细胞可以抑制可能的运动方向。 不同的基于伪豆荚的化学轴策略自然出现,取决于环境及其动力学。 例如,在静态梯度中,细胞可以以伪豆荚精度为代价更快地反应,这在嘈杂的浅梯度中特别有用,因为它矛盾地增加了化学精度。 相比之下,在动力学梯度中,细胞形成新伪豆荚。 总体而言,我们的工作展示了机械智能,以实现高化学轴性能,具有最小的细胞调节。
大型语言模型LLM改变了AI,并在各种任务上实现了突破性的性能 在科学中,LLMs最有趣的应用是假设形成LLMs的一个特征,其概率结构的结果是,输出文本不一定是训练文本中有效的推断 这些被称为幻觉,并且在许多应用中都是有害的。 在科学中,一些幻觉可能是有用的新假设,其有效性可以通过实验室实验进行测试LLM GPT4假设新型协同配对FDA批准的针对MCF7乳腺癌细胞系相对于非肿瘤乳细胞系MCF10A的非癌症药物在第一轮实验室实验中,GPT4成功地发现了12个测试中的三种药物组合,其协同评分高于阳性对照GPT4,然后根据其初始结果产生了新的组合,在四个测试的L中产生了三个具有正协同作用分数的阳性。
糖尿病是一种以血液中葡萄糖浓度恒定升高为特征的文明慢性疾病。 许多过程都涉及葡萄糖调节,它们的相互作用非常复杂。 为了更好地理解这些过程,我们为自己设定了一个目标,以创建一个全身葡萄糖调节的Petri净模型。 到目前为止,我们已经设法创建了一个肝脏中葡萄糖的糖解和合成模型,以及健康和糖尿病患者葡萄糖调节的一般概述模型。 在本文中,我们介绍了胰腺β细胞中胰岛素分泌的Petri Nets模型,以及胰腺α细胞中的胰高血糖素。 这两种激素具有相互相反的作用:胰岛素预防高血糖和胰高血糖素预防低血糖。 了解胰岛素和胰高血糖素分泌的机制是了解糖尿病的基础。 我们还介绍了一个模型,其中两个过程一起发生,取决于血糖水平。 分析了每个模型的动态。 此外,我们遵循标准转换规则,将整体胰岛素和胰高血糖素分泌系统转换为Boolean网络。
No more items to load.