An agentic system with reinforcement-learned subsystem improvements for parsing form-like documents
Ayesha Amjad, Saurav Sthapit, Tahir Qasim Syed
从发票,采购订单,账单和财务文件等形式文件中提取字母数字数据通常通过视觉(OCR)和学习算法或单体管道进行,系统改进潜力有限。 我们提出了一个代理AI系统,利用大型语言模型(LLM)代理和强化学习(RL)驱动代理,在LLM推理不确定性下自动进行一致的,自我改进的提取。 我们的工作突出了基于单片LLM的提取的局限性,并引入了一个模块化的多代理框架,其中包含特定任务的提示和RL奖励和惩罚策略,以指导元提示代理从过去的错误中学习并改善基于提示的代理代理。 这种自我纠正的自适应系统处理不同的文档,文件格式,布局和LLM,旨在自动准确地提取信息,而无需人工干预。 在SOIRE和CORD的两个基准数据集上报告的结果对于代理AI框架很有希望。
Extracting alphanumeric data from form-like documents such as invoices, purchase orders, bills, and financial documents is often performed via vision (OCR) and learning algorithms or monolithic pipelines with limited potential for systemic improvements. We propose an agentic AI system that leverages Large Language Model (LLM) agents and a reinforcement learning (RL) driver agent to automate consistent, self-improving extraction under LLM inference uncertainty. Our work highlights the limitations...