FR-LUX: Friction-Aware, Regime-Conditioned Policy Optimization for Implementable Portfolio Management
Jian'an Zhang
交易成本和制度转移是纸质投资组合在实时交易中失败的主要原因。 我们引入了FR-LUX(Frction-aware,Regime-conditioned Learning under eExecution cost),这是一个强化学习框架,可以学习成本后的交易政策,并且在波动性流动性制度中保持稳健。 FR-LUX集成了三种要素:(i)将比例和影响成本相结合的微观结构一致的执行模型,直接嵌入奖励中;(ii)一个限制库存流量变化而不是日志的交易空间信任区域,产生稳定的低周转更新;(iii)明确的制度条件,因此该策略专门处理LL / LH / HL / HH状态,而不会使数据碎片化。 在具有多个随机种子的4 x 5个制度和成本水平网格上,FR-LUX通过狭窄的引导信标间隔实现了最高平均夏普比,保持了比强基线更平坦的成本效益坡,并在给定的周转预算下实现了卓越的风险回报效率。 配对情景水平的改进严格为阳性,并且在多次测试校正后仍然具有统计学意义。 我们在凸摩擦下提供最佳性,在KL信任区域下的单调改善,由于比例成本导致的长期周转边界和诱导不动作带,制度条件政策的正价值优势以及成本错误特异性的稳健性提供正式保证。 该方法是可实施的:成本由标准流动性代理校准,情景级推理避免伪复制,所有数字和表都可以从发布的工件中复制。
Transaction costs and regime shifts are major reasons why paper portfolios fail in live trading. We introduce FR-LUX (Friction-aware, Regime-conditioned Learning under eXecution costs), a reinforcement learning framework that learns after-cost trading policies and remains robust across volatility-liquidity regimes. FR-LUX integrates three ingredients: (i) a microstructure-consistent execution model combining proportional and impact costs, directly embedded in the reward; (ii) a trade-space trust...