LA-MARRVEL: A Knowledge-Grounded and Language-Aware LLM Reranker for AI-MARRVEL in Rare Disease Diagnosis
Jaeyeon Lee, Hyun-Hwan Jeong, and Zhandong Liu
诊断罕见疾病需要将基因发现与通常非结构化的参考文本联系起来。 目前的管道收集许多候选基因,但临床医生仍然花费大量时间过滤假阳性,并将论文和数据库的证据结合起来。 一个关键的挑战是语言:表型描述和继承模式是用散文写成的,而不是用表格完全捕获的。 大型语言模型(LLM)可以读取这样的文本,但临床使用需要基于可引用的知识和稳定,可重复的行为。 我们探索了一个知识基础和语言意识的重新排名层,在高召回的第一阶段管道之上。 目标是提高精度和可解释性,而不是取代标准的生物信息学步骤。 我们使用专家构建的背景和共识方法来减少LLM变异性,产生更短,更合理的基因列表供专家审查。 LA-MARRVEL实现了最高的精度,优于其他方法 - 包括传统的生物信息学诊断工具(AI-MARRVEL,Exomiser,LIRICAL)和天真的大型语言模型(例如Anthropic Claude) - 平均Recall@5为94.10%,比AI-MARRVEL提高了+3.65个百分点。 LLM生成的推理提供了关于表型匹配和遗传模式的明确散文,使临床审查更快,更容易。 LA-MARRVEL有三个部分:专家设计的背景,丰富表型和疾病信息;一个排名投票算法,结合了多个LLM运行,选择一个共识排名的基因列表;和AI-MARRVEL管道,提供第一阶段排名和基因注释,在BG,DDD和UDN队列的罕见疾病诊断中已经被称为最先进的方法。 在线AI-MARRVEL包括LA-MARRVEL作为LLM功能,网址为https : / /ai.marrvel.org 。 我们根据来自真实世界诊断患者独立队列的三个数据集来评估LA-MARVEL。
Diagnosing rare diseases requires linking gene findings with often unstructured reference text. Current pipelines collect many candidate genes, but clinicians still spend a lot of time filtering false positives and combining evidence from papers and databases. A key challenge is language: phenotype descriptions and inheritance patterns are written in prose, not fully captured by tables. Large language models (LLMs) can read such text, but clinical use needs grounding in citable knowledge and sta...