ChemDFM-R: An Chemical Reasoner LLM Enhanced with Atomized Chemical Knowledge
Zihan Zhao, Bo Chen, Ziping Wan, Lu Chen, Xuanze Lin, Shiyang Yu, Situo Zhang, Da Ma, Zichen Zhu, Danyang Zhang, Huayang Wang, Zhongyang Dai, Liyang Wen, Xin Chen, Kai Yu
虽然大型语言模型(LLM)取得了令人印象深刻的进展,但它们在化学等科学领域的应用仍然受到浅层领域理解和推理能力有限的阻碍。 在这项工作中,我们专注于化学的特定领域,并开发化学推理器LLM,ChemDFM-R。 我们首先构建了一个全面的原子化知识点数据集,以增强模型对化学的基本原理和逻辑结构的理解。 然后,我们提出了一个混合来源的蒸馏策略,将专家策划的知识与一般域推理技能相结合,其次是特定领域的强化学习,以增强化学推理。 对各种化学基准的实验表明,ChemDFM-R在提供可解释的、原理驱动的输出的同时,实现了尖端的性能。 进一步的案例研究说明了明确的推理链如何显著提高模型在实际人类-AI协作场景中的可靠性、透明度和实用性。
While large language models (LLMs) have achieved impressive progress, their application in scientific domains such as chemistry remains hindered by shallow domain understanding and limited reasoning capabilities. In this work, we focus on the specific field of chemistry and develop a Chemical Reasoner LLM, ChemDFM-R. We first construct a comprehensive dataset of atomized knowledge points to enhance the model's understanding of the fundamental principles and logical structure of chemistry. Then, ...