Application Of Large Language Models For The Extraction Of Information From Particle Accelerator Technical Documentation
Qing Dai, Rasmus Ischebeck, Maruisz Sapinski, Adam Grycner
遗留加速器系统的大量技术文档,加上经验丰富的人员的退休,突出表明迫切需要有效的方法来保存和转让专业知识。 本文探讨了大型语言模型(LLM)的应用,以自动化和增强粒子加速器技术文档中的信息提取。 通过利用LLM,我们的目标是解决知识保留的挑战,使嵌入在遗留文档中的领域专业知识的检索成为可能。 我们介绍了使LLM适应此专业领域的初步结果。 我们的评价证明了LLM在提取,总结和组织知识方面的有效性,大大降低了随着人员退休而失去宝贵见解的风险。 此外,我们讨论了当前LLM的局限性,例如可解释性和处理稀有领域特定术语,并提出改进策略。 这项工作突出表明,法学硕士在维护机构知识和确保高度专业化领域的连续性方面发挥关键作用的潜力。
The large set of technical documentation of legacy accelerator systems, coupled with the retirement of experienced personnel, underscores the urgent need for efficient methods to preserve and transfer specialized knowledge. This paper explores the application of large language models (LLMs), to automate and enhance the extraction of information from particle accelerator technical documents. By exploiting LLMs, we aim to address the challenges of knowledge retention, enabling the retrieval of dom...