42digest首页
SynthPert:通过细胞扰动预测的合成推理痕迹增强LLM生物推理

SynthPert: Enhancing LLM Biological Reasoning via Synthetic Reasoning Traces for Cellular Perturbation Prediction

Lawrence Phillips, Marc Boubnovski Martell, Aditya Misra, Josefa Lia Stoisser, Cesar A. Prada-Medina, Rory Donovan-Maiye, Kaspar Märtens

arXiv
2025年9月29日

预测细胞对遗传扰动的反应是系统生物学的一个基本挑战,对于推进治疗发现和虚拟细胞建模至关重要。 虽然大型语言模型(LLM)显示出生物推理的前景,但由于在适应结构化实验数据方面的挑战,它们应用于扰动预测仍然没有得到探索。 我们介绍了SynthPert,这是一种新颖的方法,通过对前沿模型产生的合成推理痕迹进行监督微调来增强LLM性能。 使用PerturbQA基准测试,我们证明我们的方法不仅实现了最先进的性能,而且超越了产生训练数据的前沿模型的能力。 我们的研究结果揭示了三个关键见解:(1)合成推理痕迹即使在部分不准确的情况下也能有效地提炼生物知识,(2)这种方法使跨细胞型泛化与87

Predicting cellular responses to genetic perturbations represents a fundamental challenge in systems biology, critical for advancing therapeutic discovery and virtual cell modeling. While large language models (LLMs) show promise for biological reasoning, their application to perturbation prediction remains underexplored due to challenges in adapting them to structured experimental data. We present SynthPert, a novel method that enhances LLM performance through supervised fine-tuning on syntheti...