在线金融相关文本数据中表达的观点对交易决策和市场走势产生了越来越深远的影响。 这一趋势凸显了情绪分析作为量化此类意见的性质和力量的工具的重要作用。 随着生成式AI(GenAI)的快速发展,受监督的微调(SFT)大型语言模型(LLM)已成为金融情绪分析的事实标准。 然而,SFT范式可能导致对训练数据的背诵,并且往往无法概括为看不见的样本。 这是金融领域的一个关键限制,其中模型必须适应以前未观察到的事件和细致入微的金融语言。 为此,我们介绍了FinDPO,这是第一个基于通过直接偏好优化(DPO)培训后人类偏好调整的金融特定LLM框架。 拟议的FinDPO在标准情绪分类基准方面实现了最先进的性能,在11之前优于现有的监督微调模型
商品交易顾问(CTA)历来依赖于趋势遵循的规则,这些规则在从长期突破截然不同的视野中运作,这些突破捕捉了在快速移动市场中蓬勃发展的短期动力信号的主要方向性移动。 尽管在趋势方面进行了大量工作,但短期长期趋势系统的相对优点和相互作用仍然存在争议。 本文通过(i)动态分解CTA回归为短期趋势,长期趋势和市场测试因素,使用贝叶斯图形模型,以及(ii)显示视野的混合如何塑造策略的风险调整性能。
在加密货币限价单簿(LOB)中检测异常值对于理解市场动态至关重要,特别是在高度波动和新兴的监管环境中。 这项研究对强大的统计方法和先进的机器学习技术进行了全面的比较分析,用于在加密货币LOB中实时异常识别。 在一个名为AITA Order Book Signal(AITA-OBS)的统一测试环境中,我们评估了13个不同模型的功效,以确定哪些方法最适合检测潜在的操纵交易行为。 通过在主要交易所的26,204条记录数据集上进行的经验评估表明,表现最佳的模型Emporical Covariance(EC)实现了6.70。
在线金融相关文本数据中表达的观点对交易决策和市场走势产生了越来越深远的影响。 这一趋势凸显了情绪分析作为量化此类意见的性质和力量的工具的重要作用。 随着生成式AI(GenAI)的快速发展,受监督的微调(SFT)大型语言模型(LLM)已成为金融情绪分析的事实标准。 然而,SFT范式可能导致对训练数据的背诵,并且往往无法概括为看不见的样本。 这是金融领域的一个关键限制,其中模型必须适应以前未观察到的事件和细致入微的金融语言。 为此,我们介绍了FinDPO,这是第一个基于通过直接偏好优化(DPO)培训后人类偏好调整的金融特定LLM框架。 拟议的FinDPO在标准情绪分类基准方面实现了最先进的性能,在11之前优于现有的监督微调模型
加密货币交易是一项具有挑战性的任务,需要整合来自多种模式的异构数据。 传统的深度学习和强化学习方法通常需要大型训练数据集,并将不同的输入编码到数值表示中,通常以可解释性为代价。 大型语言模型(LLM)代理的最新进展证明了处理多模态数据和支持复杂投资决策的能力。 在这些进展的基础上,我们介绍了MountainLion,一个多模式,多代理的金融交易系统,协调专门的基于LLM的代理来解释金融数据并产生投资策略。 MountainLion处理文本新闻,烛台图表和交易信号图表,以产生高质量的财务报告,同时还可以通过数据驱动的用户交互和问答来修改报告和投资建议。 一个中央反思模块分析历史交易信号和结果,不断完善决策过程,系统能够实时报告分析、总结、动态调整投资策略。 经验结果证实,MountainLion通过情境宏观经济和资本流动信号系统地丰富了技术价格触发因素,提供了一个更具可解释性,稳健和可操作的投资框架,可以提高回报并加强投资者信心。
传统的长期短期记忆(LSTM)网络对于处理顺序数据是有效的,但存在梯度消失和难以捕获长期依赖性等限制,这可能会影响其在股票交易等动态和风险环境中的表现。 为了解决这些限制,本研究探讨了新引入的扩展长期短期内存(xLSTM)网络与自动化股票交易的深度强化学习(DRL)方法的使用情况。 我们提出的方法利用 xLSTM 网络在演员和评论家组件,实现时间序列数据和动态市场环境的有效处理。 接近政策优化(PPO)具有平衡勘探和开发的能力,用于优化交易策略。 在全面的时间表上使用主要科技公司的财务数据进行了实验,表明基于xLSTM的模型在关键交易评估指标方面优于基于LSTM的方法,包括累积回报,每次交易的平均盈利能力,最大收益率,最大回调和夏普比率。 这些发现标志着xLSTM在增强基于DRL的股票交易系统方面的潜力。
本文介绍了一项贸易订购规则,旨在减少自动做市商(AMM)驱动的分散式交易所的区块内价格波动。 这里引入的订购规则,聪明的提前波动性减少(CLVR),在去中心化金融的(共同)框架下运作,允许一些实体在结算之前观察交易请求,将它们组装成“块”,并按自己喜欢的方式订购。 在AMM交易所,资产价格由于每次交易而持续透明地更新,因此交易订单具有很高的财务价值。 CLVR旨在为交易者的利益订购交易。 我们的主要关注点是区块内价格稳定(最小化波动性),这对交易者有两个主要好处:它降低了交易失败率,并允许交易者获得更接近于他们提交交易的参考价格。 我们表明,CLVR构建了一个排序,该排序以小的计算成本将价格波动性降至最低,并且可以在外部进行微量验证。
经济学和人工智能的一个核心挑战是解释金融行为(如信贷、保险和贸易)如何在没有正式机构的情况下出现。 我们认为这些功能不是机构设计的产物,而是单一行为基质的结构化扩展:互惠。 互惠远非衍生战略,而是早期人类社会的基础逻辑,即管理商品流通,债务监管,并在市场,货币或正式规则之前保持长期合作。 贸易,通常被认为是金融体系的起源,在这里被重新构建为互惠的规范形式:同时,对称和伙伴-contingent。 基于这一逻辑,我们重建了四种核心财务职能——信贷、保险、代币交易所和投资——作为不同条件下相同基本原则的表述。 通过将金融行为建立在最低限度的、可模拟的互惠互动动态中,该框架将重点从机构工程转移到行为计算,为在人类和人工代理中模拟分散的财务行为提供了新的基础。
商品交易顾问(CTA)历来依赖于趋势遵循的规则,这些规则在从长期突破截然不同的视野中运作,这些突破捕捉了在快速移动市场中蓬勃发展的短期动力信号的主要方向性移动。 尽管在趋势方面进行了大量工作,但短期长期趋势系统的相对优点和相互作用仍然存在争议。 本文通过(i)动态分解CTA回归为短期趋势,长期趋势和市场测试因素,使用贝叶斯图形模型,以及(ii)显示视野的混合如何塑造策略的风险调整性能。
机器学习模型测试的正确设计和架构,特别是在应用于量化财务问题方面,是至关重要的。 在这个过程中,最重要的是选择用于训练、验证、估计和调优超参数的适当的损失函数。 因此,在这项研究中,通过股票和加密货币资产的经验实验,我们引入了平均绝对定向损失(MADL)功能,该功能更适合优化算法投资策略中使用的预测生成模型。 MADL函数结果比较了Transformer和LSTM模型,我们发现几乎在每种情况下,Transformer的结果都明显优于LSTM。
在加密货币限价单簿(LOB)中检测异常值对于理解市场动态至关重要,特别是在高度波动和新兴的监管环境中。 这项研究对强大的统计方法和先进的机器学习技术进行了全面的比较分析,用于在加密货币LOB中实时异常识别。 在一个名为AITA Order Book Signal(AITA-OBS)的统一测试环境中,我们评估了13个不同模型的功效,以确定哪些方法最适合检测潜在的操纵交易行为。 通过在主要交易所的26,204条记录数据集上进行的经验评估表明,表现最佳的模型Emporical Covariance(EC)实现了6.70。
本文对以太坊上集中式和分散式交易所(CEX-DEX)之间的套利背后的经济学和动态进行了全面的实证分析。 我们改进了保湿法,以识别从链上数据中的套利交易,并引入强大的经验框架来估计套利收入,而无需了解交易者在CEX上的实际行为。 利用从2023年8月至2025年3月的19个月广泛的数据集,我们估计从7,203,560名已确定的CEX-DEX套利中19名主要的CEX-DEX搜索者提取的总计2.338亿美元。 我们的分析揭示了越来越多的集中化趋势,因为三个搜索者捕获了体积和提取价值的四分之三。 我们还证明,搜索者的盈利能力与与块构建器的集成水平有关,并发现独家搜索者与构建者的关系及其市场影响。 最后,我们纠正了以前被低估的块构建者与搜索者垂直整合的盈利能力。 这些见解照亮了MEV景观最黑暗的角落,并突出了CEX-DEX套利对以太坊去中心化的重大影响。
在这篇文章中,我们开发了一个基于内核的框架,用于在均值最优标准下构建动态的、依赖路径的交易策略。 基于(Muca Cirone和Salvi,2025)的理论结果,我们将交易策略参数化为复制内核Hilbert空间(RKHS)中的函数,从而实现灵活和非马尔可维处理最佳投资组合问题的方法。 我们将其与基于签名的框架(Futter,Horvath,Wiese,2023)进行比较,并证明当资产动力学或预测信号表现出合成和市场数据示例的时间依赖性时,两者都显着优于经典的马尔科维方法。 在这种情况下使用内核提供了显著的建模灵活性,因为特征嵌入的选择可以从随机签名到神经网络架构的最终层。 至关重要的是,我们的框架保留了封闭式解决方案,并提供了基于梯度优化的替代方案。
我们提出了一个数学上严格的框架,用于识别和完成去中心化交换(DEX)聚合器中的必然性(CoW)循环。 与CoWSwap等现有的基于拍卖的系统不同,我们的方法引入了一种资产矩阵公式,该公式不仅使用神谕价格和正式保护法验证可行性,而且还完成了使用图形遍历发现并通过不平衡校正解决的交换订单的部分CoW循环。 我们定义桥接订单,并显示由此产生的执行是无滑点和LP的资本保存。 应用于现实世界的Arbitrum交换数据,我们的算法演示了CoW周期的有效发现,并支持插入原子循环闭合的合成订单。 这项工作可以被认为是提供做市商的流动性的潜在三角洲中性策略的细节:结构化的CoW周期执行。
在过去的30年里,美国股市的几乎所有涨幅都是一夜之间获得的,而平均日内回报率为负或持平。 我们发现,这种效应的很大一部分可以通过日内和夜间新闻的特征来解释。 我们的分析使用了240万篇新闻文章的集合。 我们应用了一种新颖的技术进行监督主题分析,根据他们解释同期市场回报的能力选择新闻主题。 我们发现,新闻主题的流行时间差异和对新闻主题的反应的差异都导致了日内和夜间回报的差异。 在样本外测试中,我们的方法预测哪些股票在一夜之间会做得特别好,特别是在日内表现不佳。 我们的方法还有助于解释日内和夜间回报的延续和逆转模式。 我们将新闻的影响与文献中提出的其他机制进行了对比,以解释夜间回报。
从病毒式玩笑到价值数十亿美元的现象,迷因币已成为加密货币市场最受欢迎的板块之一。与比特币或以太坊等注重实用性的加密资产不同,迷因币的价值主要来自社区情绪,这使得它们容易受到操纵。本研究对迷因币生态系统进行了跨链分析,考察了以太坊、BNB Smart Chain、Solana和Base链上的34,988种代币。我们描述了迷因币的代币经济学特征,并通过为期三个月的纵向分析追踪其增长。研究发现,在高回报代币(>100
金融情绪分析对于理解新闻对股价的影响至关重要。 最近,由于其先进的文本分析能力,大型语言模型(LLM)已被广泛采用。 然而,这些模型通常只考虑新闻内容本身,而忽略了它的传播,这阻碍了对短期股票走势的准确预测。 此外,当前方法通常缺乏足够的上下文数据和提示中的明确说明,限制了LLM解释新闻的能力。 在本文中,我们提出了一种数据驱动的方法,通过结合新闻传播广度,上下文数据和明确的指示来增强基于LLM的情绪情绪的股票运动预测。 我们收集最近与公司相关的新闻,以评估其影响力和影响力,通过更具体的数据和精确的指示丰富提示。 这些数据用于构建指令调整数据集,以微调LLM用于预测短期股价走势。 我们的实验结果表明,与现有方法相比,我们的方法将预测精度提高了8%。
虽然由于高噪音、重尾和战略相互作用,财务数据提出了最具挑战性和最有趣的序列建模任务之一,但由于缺乏对定量评估范式的共识,这一领域的进展受到了阻碍。 为了解决这个问题,我们介绍了在python中实现的基准LOB-Bench,旨在评估LOBSTER格式的限序书(LOB)的生成式消息按顺序数据的质量和现实性。 我们的框架衡量生成和真实LOB数据之间的条件统计和无条件统计的分布差异,支持灵活的多变量统计评估。 该基准还包括常用的LOB统计数据,如传播,订单量,订单不平衡和消息到达时间,以及来自训练有素的判别器网络的分数。 最后,LOB-Bench包含“市场影响指标”,即数据中特定事件的交叉相关性和价格响应功能。 我们对生成式自动回归状态空间模型、(C)GAN 以及参数 LOB 模型进行基准测试,并发现自回归的 GenAI 方法击败了传统模型类。
我们考虑一个顺序的决策设置,在每一轮t中,做市商向 A_t 传入的交易者(接受者)发布买入价和要价 A_t ,对某个资产的一个单位进行私人估值。 如果交易者的估值低于买入价,或高于要价,则发生交易(卖出或买入)。 如果交易发生在回合 t ,那么让 M_t 成为市场价格(仅在回合结束时观察到),则制造商的效用是 M_t - B_t 如果制造商购买了该资产,如果他们出售该资产,则 A_t - M_t。 我们描述了制造商对最佳固定出价选择和在市场价格和估值顺序上的各种假设(对抗性,i.i.d.及其变体)的遗憾。 我们的上限分析揭示了与首次价格拍卖和动态定价相关的一个有趣的联系。 我们的主要技术贡献是立普施茨分布和价格与估值之间独立性的i.i.d.案例的下限。 分析中的困难源于奖励和反馈功能的独特结构,允许算法通过任意的方式毕业“探索成本”来获得信息。
尽管近年来对时间序列预测越来越重视,但许多研究已经提出了各种解决方案来解决时间序列预测中遇到的挑战,旨在提高预测性能。 然而,将这些时间序列预测模型有效地应用于金融资产定价领域仍然是一个具有挑战性的问题。 仍然需要一座桥梁,将尖端的时间序列预测模型与金融资产定价联系起来。 为了弥补这一差距,我们进行了以下努力:1)我们从金融领域构建了三个数据集;2)我们从最近的研究中选择了十多个时间序列预测模型,并验证了他们在财务时间序列中的表现;3)除了MSE和MAE之外,我们还开发了新的指标,msIC和msIR,以展示模型捕获的时间序列相关性;4)我们为这三个数据集设计了财务特定任务,并评估了这些预测模型的实际性能和应用潜力。 我们希望开发的新评估套件FinTSBridge能够提供有关金融领域先进预测模型的有效性和稳健性的宝贵见解。
金融市场的最佳执行是指在一段时间内战略性地交易大量资产的过程,通过平衡市场影响成本与时间或波动风险之间的权衡,实现最佳结果。 传统的最优执行策略,如静态的Almgren-Chriss模型,在动态金融市场中往往证明是次优的。 本文提出了基于流匹配模型的新型模仿学习框架FlowOE,以解决这些限制。 FlowOE从多样化的专家传统策略中学习,并根据当前的市场条件适应性地选择最合适的专家行为。 一个关键的创新是在模仿过程中加入精炼损失函数,使流OE不仅可以模仿,还可以改进学习的专家行动。 据我们所知,这项工作是第一个在随机最佳执行问题中应用流匹配模型的工作。 跨各种市场状况的实证评估表明,LuptoOE显著优于经过特殊校准的专家模型和其他传统基准,通过降低风险获得更高的利润。 这些结果强调了 FlowOE 的实际适用性和潜力,以增强适应性最优执行力。
加密货币价格动态主要是由限价订单簿(LOB)中的微观结构性供需失衡推动的,但LOB数据的高度嘈杂性使信号提取过程复杂化。 之前的研究表明,深度学习架构可以在预处理的股票和期货LOB数据上产生有希望的预测性能,但它们通常将模型复杂性视为一种不合格的美德。 在本文中,我们旨在研究在“黑箱ish”神经网络中添加额外的隐藏层或参数是否真正增强了短期价格预测,或者收益是否主要归因于数据预处理和特征工程。 我们对从可解释基线,逻辑回归,XGBoost到深度架构(DeepLOB,Conv1D + LSTM)的BTC / USDT LOB快照进行了一系列模型的基准测试,这些模型使用公开可用的Bybit数据以100 ms到多秒间隔采样。 我们引入了两个数据过滤管道(Kalman,Savizky Golay),并评估二进制(上/下)和三(向上/平/下)标签方案。 我们的分析比较了基于样品精度、延迟和鲁棒性的模型与噪声。 结果表明,通过数据预处理和超参数调优,更简单的模型可以匹配甚至超过更复杂的网络的性能,提供更快的推理和更大的可解释性。
根据《交易所法》,1934年的非法内幕交易是滥用特权公司信息。 虽然“例行公事”的“机会主义”内幕交易之间存在模糊的界限,但发现内部人士的策略,以操纵公平的市场价格,这对手工工程方法来说是一个艰难的战斗。 在由多个协方体结构构建的详细高维金融和贸易数据的背景下,在这项研究中,我们探索,实施并提供与现有研究的详细比较(Deng等人。 (2019))并通过将主要组件分析集成到随机森林(PCA-RF)中,然后独立实施自动端到端的最先进的方法,然后独立随机森林(RF)与320和3984随机选择,半手动标记和标准化交易来自多个行业。 这些设置成功地发现了潜在的结构,并发现了非法的内幕交易。 在多种场景中,我们表现最佳的模型准确地分类了96.43%的交易。 在所有交易中,模型发现95.47是合法的,98.00是非法的。 此外,该模型在将合法分类为非法时很少犯的错误,只错过了2.00%。 除了分类任务,模型生成的基于Gini Impurity的特征排名,我们的分析显示,基于排列值的所有权和治理相关功能起着重要作用。 总之,一种简单而强大的自动化端到端方法可以缓解劳动密集型活动,以重定向资源,以加强规则制定和跟踪未捕获的非法内幕交易交易。 我们强调,发达的金融和交易功能能够发现欺诈行为。