AI基础研究具身智能 AI金融

本网站上的内容仅供参考，不提供医疗或其他专业建议，不代表活水快报、贡献者或合作伙伴的观点。

© 2024-2025 活水快报 - 42Digest.

|

京ICP备2024044642号-15

交易与市场微观结构研究快报

相关分类

定量金融学

Quantitative Finance

计算金融学

Computational Finance

金融经济学

Economics

通用金融学

General Finance

定量金融学

Quantitative Finance

计算金融学

Computational Finance

金融经济学

Economics

通用金融学

General Finance

最新研究

RL-Exec:机会最优清算的影响意识强化学习,在BTC-USD回放上优于TWAP和图书流动性VWAP

我们研究BTC-USD限价账簿(LOB)固定期限的机会最优清算。我们介绍了RL-Exec,一种经过历史重播训练的PPO代理,增加了内源性瞬态冲击(弹性),部分填充,制造商/获取者费用和延迟。该政策观察到深度-20 LOB特征加上微观结构指标,并在仅销售库存限制下采取行动,以达到剩余目标。评估遵循严格的时间分割(火车:2020年1月;测试:2月2020年)和每日协议:每个测试日,我们运行十个独立开始时间,并汇总到一个单一的每日得分,避免伪复制。我们将代理与(i)TWAP和(ii)使用相反订单簿流动性(前20级)的类似VWAP的基线分配进行比较,两者都在相同的时间戳和成本上执行。统计推理使用单面Wilcoxon签名级测试,每日RL基线差异与Benjamini-Hochberg FDR校正和引导置信区间。在2月2020日的测试中,RL-Exec大大优于基线,差距随执行视界增加(30分钟时+2-3 bps,60分钟+7-8 bps,120分钟+23 bps)。代码: github.com/Giafferri/RL-Exec

统计金融学机器学习交易与市场微观结构

ABIDES-MARL:一个多代理强化学习环境,用于内源性价格形成和执行,限价单

我们介绍了ABIDES-MARL,这是一个将新的多智能强化学习(MARL)方法与新的现实限序书(LOB)模拟系统相结合的框架,以研究复杂金融市场游戏中的平衡行为。该系统通过将状态集合与内核中断脱钩来扩展 ABIDES-Gym,实现多个自适应代理的同步学习和决策,同时保持与标准 RL 库的兼容性。它保留了价格时间优先级和离散蜱尺寸等关键市场特征。从方法上讲,我们使用MARL近似多周期交易游戏中的均衡行为,具有有限数量的异构代理 - 知情交易者,流动性交易者,噪声交易者和竞争做市商 - 所有这些都具有个人价格影响。这种设置通过在战略交易环境中嵌入流动性交易者的优化问题,将最佳执行和市场微观结构联系起来。我们通过在模拟系统中解决扩展的Kyle模型来验证该方法,从而恢复逐渐的价格发现现象。然后,我们将分析扩展到流动性交易者的问题,即市场流动性产生内生,并表明,在均衡时,执行策略塑造了做市商的行为和价格动态。 ABIDES-MARL为分析现实市场中的平衡和战略适应提供了可重复的基础,并有助于建立经济可解释的金融智能AI系统。

交易与市场微观结构计算机科学与博弈论多智能体系统系统与控制

JaxMARL-HFT:用于高频交易的GPU加速大规模多代理强化学习

高频金融市场的基于代理的建模(ABM)方法很难校准和验证,部分原因是定义固定代理策略创造了很大的参数空间。多智能体强化学习(MARL)可以实现更现实的代理行为并减少自由参数的数量,但迄今为止,沉重的计算成本限制了研究工作。为了解决这个问题,我们介绍了JaxMARL-HFT(基于JAX的多代理强化学习用于高频交易),这是第一个针对按订单(MBO)数据进行高频交易(HFT)的GPU加速开源多代理强化学习环境。 JaxMARL-HFT扩展了JaxMARL框架,并在JAX-LOB实现的基础上,旨在处理一组异构的代理,实现多样化的观察/动作空间和奖励功能。它的设计灵活,因此也可以用于单代理RL,或扩展为具有固定策略代理的ABM。与同一硬件上最先进的参考实现相比,利用 JAX 可将端到端培训时间缩短240倍。这种显着的加速使得利用高频交易中可用的大型颗粒数据集以及执行交易中强大而高效的MARL研究所需的广泛超参数扫描是可行的。我们演示了JaxMARL-HFT与独立的近端策略优化(IPPO)在双人环境中的使用,订单执行和做市代理,使用一年的LOB数据(4亿订单),并表明这些代理学习优于标准基准。 JaxMARL-HFT框架的代码可在GitHub上使用。

交易与市场微观结构多智能体系统

贸易执行流程作为市场动态的下源

在这项工作中,我们通过实验证明,执行流程I = dV/dt是市场动态的基本驱动力。我们开发了一个数值框架,使用Radon-Nikodym导数来计算采样时刻的执行流。这种方法的一个显着特点是它能够自动确定可以作为可操作触发的阈值。该技术还直接从相应的特征概率来确定特征时间尺度。该方法已在实际市场数据上进行了验证,以支持这些发现。此外,我们引入了基于Christoffel函数谱的框架,该函数谱在输入属性的任意非退化线性变换下是不变的,并且提供了传统主成分分析(PCA)的替代品,该分析仅限于单数不变。

计算金融学数值分析交易与市场微观结构

通过强化学习实现最佳执行

本研究通过强化学习研究最佳执行策略的发展,旨在确定交易者在有限的时间内买卖库存的最有效方法。我们提出的模型利用从限价单簿当前状态衍生的输入特性,并以高频运行,以最大限度地控制。为了模拟这种环境并克服与依赖历史数据相关的限制,我们利用多代理市场模拟器ABIDES,该模拟器在限价单簿中提供了多样化的深度水平。我们提出了自定义的MDP配方,然后是我们的方法的结果,并根据标准执行策略对性能进行基准测试。结果表明,强化学习代理优于标准策略,并为现实世界的交易应用提供了实际基础。

交易与市场微观结构机器学习

正确地点,正确的时间:基于市场模拟的RL执行优化

执行算法对现代交易至关重要,它们使市场参与者能够执行大订单,同时最大限度地减少市场影响和交易成本。随着这些算法变得越来越复杂,优化它们变得越来越具有挑战性。在这项工作中,我们提出了一个强化学习(RL)框架,用于发现最佳的执行策略,在基于响应式代理的市场模拟器中进行评估。这个模拟器创建响应式订单流,并允许我们分解滑入其组成部分:市场影响和执行风险。我们使用Almgren和Chriss工作的高效前沿来评估RL代理的性能,衡量其平衡风险和成本的能力。结果表明,RL衍生的策略始终优于基线,并在高效前沿附近运行,显示出优化风险和影响的强大能力。这些发现强调了强化学习作为交易者工具包中的强大工具的潜力。

计算金融学人工智能机器学习风险管理

TABL-ABM:合成LOB生成的混合框架

最近深度学习模型在金融交易中的应用加剧了对高保真金融时间序列数据的需求。这种合成数据可用于补充历史数据,以训练大型交易模型。生成式应用的最先进的模型通常依赖于大量的历史数据和大型复杂模型。这些模型从自回归和基于扩散的模型到架构上更简单的模型,如时间注意力双线性层。基于代理的建模限制订单书动态的方法也可以通过交易者行为的机械模型重现交易活动。在这项工作中,我们展示了一个基于代理的模拟日内交易活动框架Chiarella模型如何与预测多变量时间序列的最具性能的深度学习模型之一TABL模型相结合。这种预测模型与匹配引擎的模拟与模拟已删除订单流的新方法相结合。我们的模拟器使我们能够使用程式化的事实来测试预测模型的生成能力。我们的结果表明,这种方法产生了现实的价格动态,然而,在分析更深的时候,部分市场微观结构没有准确重现,突出了将更复杂的代理行为纳入建模框架以帮助解释尾部事件的必要性。

计算金融学人工智能多智能体系统交易与市场微观结构

与魔鬼交易:基础模型策略的风险和回报

基础模型——已经在自然语言处理等领域发生了变革——现在开始出现金融时间序列任务。虽然这些预训练的架构承诺提供多种预测信号,但对于它们如何塑造其上构建的交易策略的风险配置文件知之甚少,这使得从业者不愿投入大量资金。在本文中,我们建议扩展资本资产定价模型(CAPM),该模型将共享基础模型引入的系统风险(如果底层模型具有真正的预测性,则有可能产生α)从可归因于自定义微调的特殊风险中分离出来,这通常不会产生系统溢价。为了对这些单独的风险进行实际估计,我们将这种分解与不确定性分离的概念保持一致,将系统风险作为认识论不确定性(植根于预训练模型)和特殊风险作为回调不确定性(在自定义适应期间引入)。在Aleatory Collapse假设下,我们说明了蒙特卡洛辍学 - 除了不确定性量化工具包中的其他方法 - 如何直接测量认识论风险,从而将交易策略映射到更透明的风险回归平面。我们的实验表明,隔离这些独特的风险因素可以更深入地了解基于基础模型的策略的性能限制,它们的模型随着时间的推移而退化,以及有针对性的改进的潜在途径。总之,我们的结果强调了在竞争激烈的金融市场中部署大型预训练模型的前景和陷阱。

计算工程、金融与科学交易与市场微观结构

隐形握手:自适应市场代理之间的默西特勾结

我们研究在一个具有内生价格形成的随机市场中适应性交易代理之间出现默契勾结。使用做市商和市场接受者之间的双人重复游戏,我们描述了可行和串通的战略特征,将价格提高到超过竞争水平。我们表明,当代理商遵循简单的学习算法(例如梯度提升)来最大化自己的财富时,由此产生的动态会汇聚到勾结策略配置文件,即使在贸易规模较小的高流动性市场中也是如此。通过强调简单的学习策略如何自然地导致默契勾结,我们的结果为人工智能驱动市场的动态提供了新的见解。

交易与市场微观结构计算机科学与博弈论机器学习

ATLAS:通过动态提示优化和多代理协调与LLM AgentS进行自适应交易

大型语言模型显示出财务决策的前景,但将它们部署为自主交易代理带来了根本性的挑战:当奖励迟到并被市场噪音遮挡时,如何调整指令,如何将异构信息流合成连贯的决策,以及如何弥合模型输出与可执行市场行动之间的差距。我们介绍了ATLAS(与LLM AgentS的自适应交易),这是一个统一的多代理框架,集成了来自市场,新闻和企业基本面的结构化信息,以支持稳健的交易决策。在ATLAS中,中央交易代理在具有订单感知的行动空间中操作,确保输出对应于可执行市场订单而不是抽象信号。代理可以在使用Adaptive-OPRO进行交易时纳入反馈,这是一种新颖的提示优化技术,通过结合实时随机反馈来动态调整提示,从而随着时间的推移提高性能。在针对特定于制度的公平研究和多个LLM家族中,Adaptive-OPRO始终优于固定提示,而基于反射的反馈未能提供系统的收益。

交易与市场微观结构人工智能

FinFlowRL:金融中自适应随机控制的模仿强化学习框架

现实世界市场中金融斗争中的传统随机控制方法,因为它们依赖于简化的假设和程式化框架。此类方法通常在特定的、定义良好的环境中表现良好,但在改变的非静止环境中产生次优结果。我们介绍了FinFlowRL,这是一个金融最优随机控制的新框架。该框架从多个专家策略中预训练自适应元策略学习,然后通过噪声空间中的强化学习进行微调,以优化生成过程。通过采用动作块生成动作序列而不是单个决策,它解决了市场的非马尔科维性质。 FinFlowRL 在不同市场条件下的表现一直优于个别优化的专家。

计算金融学人工智能机器学习交易与市场微观结构

SoK:去中心化预测市场(DePM)的市场微观结构

分散式预测市场(DePM)允许公开参与基于事件的下注,而无需完全依赖集中中介。我们回顾了可追溯到2011年的 DePM 的历史,其中包括数以百计的提案。也许令人惊讶的是,像Polymarket这样的现代DePM在物质上偏离了Truthcoin和Augur v1等早期设计。我们使用我们的审查来呈现由七个阶段组成的模块化工作流程:底层基础设施,市场主题,股票结构和定价,交易,市场解决方案,结算和存档。对于每个模块,我们列举设计变体,分析围绕去中心化、表现力和操纵阻力的权衡。我们还为对生态系统感兴趣的研究人员确定了开放性问题。

计算工程、金融与科学密码学与安全交易与市场微观结构

通用技术分析。交易量和风险的影响

我们概括动量指标的想法,将交易量视为倍增因素。我们根据经典或广义技术分析比较了遵循策略所获得的回报,同时考虑到一种风险投资者标准。

统计力学数值分析计算物理学交易与市场微观结构

尾安全套期保值:在无套利市场中使用白盒CBF-QP安全层解释风险敏感强化学习

我们引入了Tail-Safe,一个面向部署性的衍生品对冲框架,该框架将分布,风险敏感的强化学习与白盒控制障碍功能(CBF)二次程序(QP)安全层结合,以适应财务限制。学习组件结合了基于IQN的分布批评者与CVaR目标(IQN-CQuaR-PPO)和尾部覆盖控制器,通过温度倾斜和尾部提升调节分位数采样,以稳定小α估计。安全组件强制执行离散时间CBF不等式以及特定域的限制 - 椭圆无贸易波段,框和速率限制以及符号一致性门 - 作为凸QP解决,其遥测(活动集,紧绷性,速率利用率,闸门得分,松弛和求解器状态)构成了可审计的治理跟踪。我们提供保证在边界模型不匹配下的安全设置的稳健向前不变性,QP的最小偏差投影解释,KL-to-DRO上限绑定将每个状态KL正则化与最坏情况CVaR,温度倾斜的CVaR估计器的浓度和样品复杂度结果,以及KL限制下的CVaR信任区域改进不等式,以及可行性持久性。从经验上讲,在无套利,微观结构感知的合成市场(SSVI → Dipre → VIX with ABIDES/MockLOB execution),Tail-Safe提高了左尾风险,而不会降低中央性能,并在QP可行时产生零硬约束违规行为。遥测映射到治理仪表板和事件工作流程,以支持可解释性和可审计性。限制包括依赖合成数据和简化执行以隔离方法上的贡献。

机器学习交易与市场微观结构

日内和频率遏制储备市场的联合投标

随着可再生能源集成增加供应可变性,电池储能系统(BESS)为平衡供需提供了可行的解决方案。本文提出了一种新的方法来优化电池BESS在多个电力市场的参与。我们制定了联合竞价策略,将参与主要频率储备市场与盘中市场的持续交易相结合,解决了现存文献中通常孤立地考虑这些市场或简化日内交易的持续性质的空白。我们的方法利用滚动内在算法的混合整数线性编程实现,用于日内决策和电荷恢复状态,以及学习分类器策略(LCS),该策略决定了市场之间的最佳容量分配。在一年多的历史德国市场数据中,全面的样本外回测证实了我们的方法:LCS将整体利润提高了4以上

计算金融学机器学习交易与市场微观结构

FR-LUX:用于可实施投资组合管理的摩擦感知、制度条件政策优化

交易成本和制度转移是纸质投资组合在实时交易中失败的主要原因。我们引入了FR-LUX(Frction-aware,Regime-conditioned Learning under eExecution cost),这是一个强化学习框架,可以学习成本后的交易政策,并且在波动性流动性制度中保持稳健。 FR-LUX集成了三种要素:(i)将比例和影响成本相结合的微观结构一致的执行模型,直接嵌入奖励中;(ii)一个限制库存流量变化而不是日志的交易空间信任区域,产生稳定的低周转更新;(iii)明确的制度条件,因此该策略专门处理LL / LH / HL / HH状态,而不会使数据碎片化。在具有多个随机种子的4 x 5个制度和成本水平网格上,FR-LUX通过狭窄的引导信标间隔实现了最高平均夏普比,保持了比强基线更平坦的成本效益坡,并在给定的周转预算下实现了卓越的风险回报效率。配对情景水平的改进严格为阳性,并且在多次测试校正后仍然具有统计学意义。我们在凸摩擦下提供最佳性,在KL信任区域下的单调改善,由于比例成本导致的长期周转边界和诱导不动作带,制度条件政策的正价值优势以及成本错误特异性的稳健性提供正式保证。该方法是可实施的:成本由标准流动性代理校准,情景级推理避免伪复制,所有数字和表都可以从发布的工件中复制。

交易与市场微观结构机器学习

跨市场能源套利业务中独立电池储能系统的优化运行

提供可再生电力是可持续未来的基础。为了实现可持续可再生能源的目标,电池储能系统(BESS)可以发挥关键作用,抵消太阳能和风力发电的间歇性。为了帮助系统,BESS可以简单地以低批发价格充电,并在高价格期间放电,这也被称为能源套利。然而,能源套利的实时执行对许多公司来说并不简单,因为存储与常规发电厂相比有着根本的不同。在这项工作中,通过描述用于交易集成BESS操作的通用框架,开发合适的背测试引擎和针对跨市场优化BESS操作的特定优化策略制定来解决独立BESS在跨市场能源套利业务中的优化操作。此外,该策略在具有敏感性分析的案例研究中进行测试,以调查预测不确定性的影响。结果表明,拟议的战略允许通过利用不断增长的市场波动来增加收入。此外,敏感性分析表明,拟议战略的稳健性,因为如果采用实际预测,将只损失部分收入。

交易与市场微观结构系统与控制

Trading-R1：通过强化学习实现基于LLM推理的金融交易

开发与人类金融分析师和交易员相媲美的专业结构化推理能力，仍然是金融AI领域的核心挑战，因为市场需要可解释性和信任。传统的时间序列模型缺乏可解释性，而LLM在将自然语言分析转化为有纪律、可执行的交易方面面临挑战。尽管推理型LLM在逐步规划和验证方面取得了进展，但它们在风险敏感的金融决策中的应用仍未得到充分探索。我们提出了Trading-R1，这是一个具有金融意识的模型，融合了战略思维和规划，用于全面的投资论点构建、基于事实的分析和波动率调整的决策制定。Trading-R1通过监督微调和采用三阶段由易到难课程的强化学习，使推理与交易原则保持一致。训练使用了Tauric-TR1-DB，这是一个包含10万个样本的语料库，涵盖18个月、14只股票和五个异构金融数据源。在六只主要股票和ETF上的评估表明，与开源和专有的指令跟随模型以及推理模型相比，Trading-R1展现出改进的风险调整后收益和更低回撤。该系统生成结构化的、基于证据的投资论点，支持有纪律且可解释的交易决策。Trading-R1终端将在https://github.com/TauricResearch/Trading-R1发布。

交易与市场微观结构人工智能计算工程、金融与科学计算与语言

顺序与并行清除机制在基于代理的人工限值顺序交换模拟中的影响

本研究考察了在人工股票市场框架内清算机制的不同计算实现对多资产价格动态的影响。我们表明,订单簿的顺序处理通过在单个时间步骤内影响交易者资本的分配来引入系统和显着的偏见。这是因为适用预算限制按顺序授予先前处理的资产优先获得资金,扭曲了个人资产需求,从而扭曲了其价格轨迹。调查结果强调,虽然整体价格水平主要由货币与股票比率等宏观因素驱动,但市场的微观结构清算机制在单个资产的价值配置中起着关键作用。这强调了仔细考虑和验证人工市场中的清算机制以准确模拟复杂的金融行为的必要性。

交易与市场微观结构分布式、并行与集群计算

基于智能合约的数字支付编程流管道框架

数字支付在蓬勃发展的数字经济中发挥着关键作用。展望未来,数字支付系统的增强需要可编程性,而不仅仅是效率和便利性,以满足不断变化的需求和复杂性。中央银行数字货币(CBDC)网络和区块链等智能合约平台支持可编程数字支付。然而,编程支付逻辑的盛行范式涉及用编程语言编写智能合约,导致高成本和重大安全挑战。本文介绍了一种新颖且通用的DLT支付编程方法 - 将数字货币转换为令牌流,然后流化智能合约以授权,聚合,锁定,直接和从源到目标帐户有效地发送这些流。通过使用一小组可配置的模板,可以生成一些专门的智能合约,并通过配置和编写来支持大多数支付逻辑。这种方法可以大大降低支付编程的成本,提高安全性、自我执行能力、适应性和可控性,从而有可能成为数字经济基础设施的重要组成部分。

交易与市场微观结构密码学与安全

继续滚动加载更多