42digest首页
SciAgent:通用科学推理的统一多代理系统

SciAgent: A Unified Multi-Agent System for Generalistic Scientific Reasoning

Xuchen Li, Ruitao Wu, Xuanbo Liu, Xukai Wang, Jinbo Hu, Zhixin Bai, Bohan Zeng, Hao Liang, Leheng Chen, Mingrui Chen, Haitian Zhong, Xuanlin Yang, Xu-Yao Zhang, Liu Liu, Jia Li, Kaiqi Huang, Jiahao Xu, Haitao Mi, Wentao Zhang, Bin Dong

arXiv
2025年11月11日

大型语言模型的最新进展使人工智能系统能够在特定领域的科学任务上实现专家级性能,但这些系统仍然狭窄且手工制作。 我们引入了SciAgent,一个统一的多代理系统,专为一般科学推理而设计 - 适应跨学科和难度水平的推理策略的能力。 SciAgent将问题解决组织为分层过程:协调员代理解释每个问题的域和复杂性,动态编排专门的工人系统,每个系统由交互推理子代理组成,用于符号演绎,概念建模,数值计算和验证。 这些代理协同组装和完善针对每个任务的推理管道。 在数学和物理奥林匹克竞赛(IMO,IMC,IPhO,CPHO)中,SciAgent始终如一地达到或超越人类金牌者的表现,展示了领域通用性和推理适应性。 此外,SciAgent已经在国际化学奥林匹克竞赛(IChO)上进行了测试,并从人类的最后一次考试(HLE)基准中选择了问题,进一步证实了该系统在不同科学领域进行概括的能力。 这项工作使SciAgent成为迈向通用科学智能-AI系统的具体步骤,能够在专家层面进行连贯的跨学科推理。

Recent advances in large language models have enabled AI systems to achieve expert-level performance on domain-specific scientific tasks, yet these systems remain narrow and handcrafted. We introduce SciAgent, a unified multi-agent system designed for generalistic scientific reasoning-the ability to adapt reasoning strategies across disciplines and difficulty levels. SciAgent organizes problem solving as a hierarchical process: a Coordinator Agent interprets each problem's domain and complexity,...