活水快报 - 42Digest

Trading-R1：通过强化学习实现基于LLM推理的金融交易

Trading-R1: Financial Trading with LLM Reasoning via Reinforcement Learning

Yijia Xiao, Edward Sun, Tong Chen, Fang Wu, Di Luo, Wei Wang

arXiv

2025年9月14日

开发与人类金融分析师和交易员相媲美的专业结构化推理能力，仍然是金融AI领域的核心挑战，因为市场需要可解释性和信任。传统的时间序列模型缺乏可解释性，而LLM在将自然语言分析转化为有纪律、可执行的交易方面面临挑战。尽管推理型LLM在逐步规划和验证方面取得了进展，但它们在风险敏感的金融决策中的应用仍未得到充分探索。我们提出了Trading-R1，这是一个具有金融意识的模型，融合了战略思维和规划，用于全面的投资论点构建、基于事实的分析和波动率调整的决策制定。Trading-R1通过监督微调和采用三阶段由易到难课程的强化学习，使推理与交易原则保持一致。训练使用了Tauric-TR1-DB，这是一个包含10万个样本的语料库，涵盖18个月、14只股票和五个异构金融数据源。在六只主要股票和ETF上的评估表明，与开源和专有的指令跟随模型以及推理模型相比，Trading-R1展现出改进的风险调整后收益和更低回撤。该系统生成结构化的、基于证据的投资论点，支持有纪律且可解释的交易决策。Trading-R1终端将在https://github.com/TauricResearch/Trading-R1发布。

Developing professional, structured reasoning on par with human financial analysts and traders remains a central challenge in AI for finance, where markets demand interpretability and trust. Traditional time-series models lack explainability, while LLMs face challenges in turning natural-language analysis into disciplined, executable trades. Although reasoning LLMs have advanced in step-by-step planning and verification, their application to risk-sensitive financial decisions is underexplored. W...

交易与市场微观结构人工智能计算工程、金融与科学计算与语言机器学习

View Source