42digest首页
正确地点,正确的时间:基于市场模拟的RL执行优化

Right Place, Right Time: Market Simulation-based RL for Execution Optimisation

Ollie Olby, Andreea Bacalum, Rory Baggott, Namid Stillman

arXiv
2025年10月25日

执行算法对现代交易至关重要,它们使市场参与者能够执行大订单,同时最大限度地减少市场影响和交易成本。 随着这些算法变得越来越复杂,优化它们变得越来越具有挑战性。 在这项工作中,我们提出了一个强化学习(RL)框架,用于发现最佳的执行策略,在基于响应式代理的市场模拟器中进行评估。 这个模拟器创建响应式订单流,并允许我们分解滑入其组成部分:市场影响和执行风险。 我们使用Almgren和Chriss工作的高效前沿来评估RL代理的性能,衡量其平衡风险和成本的能力。 结果表明,RL衍生的策略始终优于基线,并在高效前沿附近运行,显示出优化风险和影响的强大能力。 这些发现强调了强化学习作为交易者工具包中的强大工具的潜力。

Execution algorithms are vital to modern trading, they enable market participants to execute large orders while minimising market impact and transaction costs. As these algorithms grow more sophisticated, optimising them becomes increasingly challenging. In this work, we present a reinforcement learning (RL) framework for discovering optimal execution strategies, evaluated within a reactive agent-based market simulator. This simulator creates reactive order flow and allows us to decompose slippa...