Trading-R1: Financial Trading with LLM Reasoning via Reinforcement Learning
Yijia Xiao, Edward Sun, Tong Chen, Fang Wu, Di Luo, Wei Wang
开发与人类金融分析师和交易员相媲美的专业结构化推理能力,仍然是金融AI领域的核心挑战,因为市场需要可解释性和信任。传统的时间序列模型缺乏可解释性,而LLM在将自然语言分析转化为有纪律、可执行的交易方面面临挑战。尽管推理型LLM在逐步规划和验证方面取得了进展,但它们在风险敏感的金融决策中的应用仍未得到充分探索。我们提出了Trading-R1,这是一个具有金融意识的模型,融合了战略思维和规划,用于全面的投资论点构建、基于事实的分析和波动率调整的决策制定。Trading-R1通过监督微调和采用三阶段由易到难课程的强化学习,使推理与交易原则保持一致。训练使用了Tauric-TR1-DB,这是一个包含10万个样本的语料库,涵盖18个月、14只股票和五个异构金融数据源。在六只主要股票和ETF上的评估表明,与开源和专有的指令跟随模型以及推理模型相比,Trading-R1展现出改进的风险调整后收益和更低回撤。该系统生成结构化的、基于证据的投资论点,支持有纪律且可解释的交易决策。Trading-R1终端将在https://github.com/TauricResearch/Trading-R1发布。
Developing professional, structured reasoning on par with human financial analysts and traders remains a central challenge in AI for finance, where markets demand interpretability and trust. Traditional time-series models lack explainability, while LLMs face challenges in turning natural-language analysis into disciplined, executable trades. Although reasoning LLMs have advanced in step-by-step planning and verification, their application to risk-sensitive financial decisions is underexplored. W...