42digest首页

最新研究

变压器模型评估中的替代损失函数

机器学习模型测试的正确设计和架构,特别是在应用于量化财务问题方面,是至关重要的。 在这个过程中,最重要的是选择用于训练、验证、估计和调优超参数的适当的损失函数。 因此,在这项研究中,通过股票和加密货币资产的经验实验,我们引入了平均绝对定向损失(MADL)功能,该功能更适合优化算法投资策略中使用的预测生成模型。 MADL函数结果比较了Transformer和LSTM模型,我们发现几乎在每种情况下,Transformer的结果都明显优于LSTM。

计算金融学机器学习交易与市场微观结构
arXiv

交易分析并解决代币化美国角色推断 国债

代币化美国 国债已成为现实世界资产(RWA)的突出子类,提供加密强制执行的,由主权债务抵押并在多个区块链网络中部署的具有收益的工具。 虽然市场迅速扩大,但对交易水平行为的实证分析仍然有限。 本文对美国进行定量、功能层面的剖析。 财政部支持的RWA代币,包括BUIDL,BENJI和USDY,横跨多链:主要是以太坊和Layer-2。 我们分析解码的合同调用隔离核心功能原语,如发行,赎回,转移和桥梁活动,揭示了机构行为者和零售用户之间行为的细分。 为了模拟地址级别的经济角色,我们引入了使用庞加莱嵌入和基于流动性的图形特征的曲率感知表示学习框架。 我们的方法优于RWA财务库数据集上的基线模型,在角色推断中,并概括为下游任务,如更广泛的区块链交易网络中的异常检测和钱包分类。 这些发现从交易层面的角度对代币化财务中的功能异质性和参与者角色提供了结构化的理解,为研究链上金融化提供了新的经验证据。

计算金融学计算工程、金融与科学机器学习
arXiv

贸易与否:估计市场风险的代理方法改善了交易决策

大型语言模型(LLM)越来越多地部署在代理框架中,其中提示触发复杂的基于工具的分析以追求目标。 虽然这些框架在包括金融在内的多个领域都显示出希望,但它们通常缺乏有原则的模型构建步骤,而是依赖于基于情绪或趋势的分析。 我们通过开发一个代理系统来解决这个差距,该系统使用LLM迭代地发现财务时间序列的随机微分方程。 这些模型生成风险指标,为每日交易决策提供信息。 我们在传统的反测试和使用市场模拟器中评估我们的系统,该模拟器引入了合成但具有因果关系的价格路径和新闻事件。 我们发现,模型知情的交易策略优于标准的基于LLM的代理,提高了多个股票的夏普比率。 我们的结果表明,将LLM与代理模型发现相结合可以增强市场风险估计,并实现更有利可图的交易决策。

统计金融学人工智能计算工程、金融与科学多智能体系统
arXiv

NMIXX:用于金融跨语言电子探索的域适应神经嵌入

通用句子嵌入模型通常难以捕获专门的金融语义,特别是在低资源语言(如韩语)中,由于特定领域的术语,时间意义变化和错位的双语词汇。 为了解决这些差距,我们介绍了NMIXX(用于金融跨语言电子探索的神经电子嵌入),一套跨语言嵌入模型,微调了18.8K高置信三胞胎,对域内释义,硬底片来自语义移位类型,以及精确的韩语英语翻译。 同时,我们发布了KorFinSTS,这是一个1,921对韩国金融STS基准,涵盖新闻,披露,研究报告和法规,旨在揭露一般基准错过的细微差别。 当根据七个开放许可基线进行评估时,NMIXX的多语种bge-m3变体实现了Spearman在英语FinSTS上的rho增益+0.10和KorFinSTS上的+0.22,优于其预适应检查点并超过了其他模型的最大幅度,同时揭示了STS性能的适度权衡。 我们的分析进一步表明,具有更丰富韩国令牌覆盖范围的模型可以更有效地适应,强调了标记器设计在低资源、跨语言设置中的重要性。 通过公开提供模型和基准,我们为社区提供了强大的工具,用于在金融领域适应多语言的表示学习。

计算与语言人工智能计算金融学
arXiv

与DNN进行渐近行为,以促进金融的近似和回归

我们提出了一个简单的方法来近似函数与给定的渐近行为通过专门构造的术语和无约束的深度神经网络(DNN)。 我们描述的方法延伸到各种无症状行为和多个维度,易于实现。 在这项工作中,我们在一维示例中演示了线性渐近行为。 我们将其应用于函数近似和回归问题,其中我们仅测量函数值(“香草机器学习”-VML)的近似值,或者在几个示例中测量函数和衍生值(“差异机器学习”-DML)的近似值。 我们看到,强制给定的渐近行为会导致更好的近似和更快的收敛。

计算金融学数值分析证券定价
arXiv

Hopfield Networks在资产配置中的应用

我们首次将现代Hopfield networks应用于投资组合优化问题。基于多个数据集,我们通过组合式净化交叉验证进行了广泛研究,并将结果与传统方法和基于深度学习的方法进行了比较。与最先进的深度学习方法(如LSTM和Transformers)相比,我们发现所提出的方法表现相当或更好,同时提供更快的训练时间和更好的稳定性。我们的结果表明,现代Hopfield networks代表了一种有前景的投资组合优化方法,为资产配置、风险管理和动态再平衡提供了高效、可扩展且稳健的解决方案。

机器学习计算金融学投资组合管理
arXiv

FinAI-BERT:基于变压器的模型,用于在财务报告中检测人工智能披露的句子级检测

人工智能(AI)在金融服务中的激增促使人们对能够系统地检测企业文件中人工智能相关披露的工具的需求不断增长。 虽然之前的方法通常依赖于关键字扩展或文档级分类,但它们在粒度,可解释性和鲁棒性方面不足。 这项研究引入了FinAI-BERT,这是一种基于域的变压器语言模型,旨在将AI相关内容分类在财务文本中的句子级别。 该模型在手动策划和平衡的数据集上进行了微调,该数据集包含来自美国银行669份年度报告(2015年至2023年)的1,586个句子。 FinAI-BERT实现了近乎完美的分类性能(精度为99.37%,F1得分为0.993),优于Logistic Regression,Naive Bayes,Random Forest和XGBoost等传统基线。 通过基于SHAP的令牌归因来确保可解释性,而偏差分析和稳健性检查证实了模型在句子长度,对抗输入和时间样本中的稳定性。 从理论上讲,该研究通过使用变压器架构进行细粒度,特定主题的分类,促进了金融NLP的发展。 实际上,它为寻求监控金融机构之间人工智能传播和框架的分析师,监管机构和学者提供了一个可扩展,透明的解决方案。

计算金融学计算与语言通用经济学金融经济学
arXiv

击败长期投资中最好的恒定再平衡投资组合:具有串行依赖性的市场凯利标准与通用学习算法的概括

在在线投资组合优化框架中,现有的学习算法产生的策略与事后最好的恒定再平衡组合相比,累积财富明显较差,尽管在渐近增长率方面是一致的。 虽然可以通过包含更多的侧面信息来提高这种没有吸引力的性能,但它在功能选择和高维设置方面增加了困难。 相反,可以利用资产回报的固有连续依赖性,如一周日和其他日历效应。 虽然潜在的串行依赖模式通常使用大型训练数据集进行检测,但本文提出了一种算法,仅使用逐渐揭示的数据来学习这种依赖性,而对其分布没有任何假设,以形成最终超过最佳恒定再平衡组合的累积财富的策略。 此外,经典的凯利标准,需要独立资产的回报,被推广为市场序列依赖性,模型为随机矩阵的独立和分布相同的过程。 在这样一个随机市场中,为固定过程设计的现有学习算法无法应用,拟议的学习算法仍然产生一种策略,在所有策略中无症状地增长到最高速度,与在广义的凯利标准下构建的最佳策略相匹配。 具有真实市场数据的实验结果表明该算法的理论保证及其性能如预期,只要串行依赖性显著,无论广义凯利标准在实验市场中的有效性如何。 这进一步肯定了该算法在一般语境中的广泛适用性。

投资组合管理信息论机器学习计算金融学
arXiv

基于强化学习的加速投资组合优化与期权定价

我们提出了一种基于强化学习(RL)的框架,用于优化投资组合优化和期权定价中使用的迭代求解器的block-preconditioner大小。投资组合优化中的协方差矩阵或期权定价模型中微分算子的离散化会导致形式为𝐀x=b的大型线性系统。高维投资组合或细网格期权定价的直接求逆会带来显著的计算成本。因此,在实际应用中通常使用迭代方法处理投资组合。然而,病态系统存在收敛缓慢的问题。传统的预处理技术通常需要针对具体问题进行参数调优。为了克服这一限制,我们利用RL动态调整block-preconditioner大小,加速迭代求解器的收敛。在一系列实际投资组合优化矩阵上的评估表明,我们的RL框架可用于调整预处理,显著加速收敛并降低计算成本。所提出的加速求解器支持动态资产配置和实时期权定价中更快的决策制定。

投资组合管理人工智能机器学习计算金融学
arXiv

深度对冲管理尾性风险

扩展Buehler等人的2019年深度对冲范式,我们创新地使用深度神经网络来参数化凸风险最小化(CVaR / ES)用于投资组合尾部风险对冲问题。 通过在危机时期的引导市场模拟器上进行全面的数字实验 - 可定制交易成本,风险预算,流动性限制和市场影响 - 我们的端到端框架不仅实现了重要的单日99

投资组合管理机器学习最优化与控制计算金融学
arXiv

我们能可靠预测美联储的下一步行动吗? 对美国采取多种模式方法 货币政策预测

由于货币行动的广泛影响,预测央行的政策决定仍然是投资者、金融机构和政策制定者面临的持续挑战。 特别是,预计美国联邦基金利率的变化对风险管理和交易策略至关重要。 传统方法仅依靠结构化宏观经济指标往往不足以捕捉央行通信中嵌入的前瞻性线索。 本研究通过将结构化数据与美联储通信的非结构化文本信号集成,研究是否可以增强预测准确性。 我们采用多模态框架,比较传统的机器学习模型、基于变压器的语言模型以及单模态和混合设置中的深度学习架构。 我们的结果表明,混合模型始终优于单模基线。 通过将FOMC文本的TF-IDF功能与XGBoost分类器中的经济指标相结合,达到0.83的测试AUC,达到最佳性能。 基于FinBERT的情绪特征略微提高了排名,但在分类方面表现较差,特别是在阶级失衡的情况下。 SHAP分析表明,稀疏、可解释的特征与政策相关的信号更紧密地对齐。 这些发现强调了透明地整合文本和结构化信号的重要性。 对于货币政策预测,更简单的混合模型可以提供准确性和可解释性,为研究人员和决策者提供可操作的见解。

投资组合管理机器学习计算金融学
arXiv

混合量子神经网络与振幅编码:推进恢复率预测

回收率预测通过增强风险评估、优化投资组合配置、提高定价准确性和支持有效的信用风险管理,在债券投资策略中发挥关键作用。 然而,由于复杂的非线性依赖性,高维特征空间以及经典的机器学习模型容易过拟合的有限样本大小条件,准确的预测仍然具有挑战性。 我们提出了具有 Amplitude Encoding 的混合量子机器学习 (QML) 模型,利用参数化量子电路 (PQC) 的统一性约束和量子比特的指数数据压缩能力。 我们评估全球回收率数据集的模型,包括1996年至2023年的1,725次观察和256个特征。 我们的混合方法明显优于使用角度编码的经典神经网络和QML模型,实现了0.228的较低根均方误差(RMSE),而分别为0.246和0.242。 它还与集成树方法(如XGBoost)进行竞争。 虽然嘈杂中级量子(NISQ)硬件的实际实施挑战仍然存在,但我们的量子模拟和嘈杂模拟器的初步结果表明了混合量子经典架构在增强恢复率预测的准确性和稳健性方面的前景。 这些发现说明了量子机器学习在塑造信用风险预测未来方面的潜力。

计算金融学机器学习量子物理学
arXiv

基于与大型语言模型和深度学习方法的信息融合的EUR-USD汇率预测

准确预测欧元/美元汇率对投资者、企业和政策制定者至关重要。 本文提出了一个新的框架,IUS,将新闻和分析的非结构化文本数据与汇率和财务指标的结构化数据集成在一起,以加强汇率预测。 IUS框架采用大型语言模型进行情绪极性评分和文本汇率变动分类。 这些文本特征与定量特征和输入到因果关系驱动功能生成器相结合。 然后使用Optuna优化的Bi-LSTM模型来预测欧元/美元汇率。 实验证明,所提出的方法优于基准模型,将MAE减少了10.69

计算金融学人工智能计算工程、金融与科学计算与语言
arXiv

量子强化学习交易代理,用于台湾股市的行业轮换

我们提出了一个混合量子经典强化学习框架,用于台湾股市的部门轮换。 我们的系统采用近端策略优化(PPO)作为骨干算法,并将经典架构(LSTM,Transformer)和量子增强模型(QNN,QRWKV,QASA)作为策略和价值网络。 自动化功能工程管道从资本份额数据中提取财务指标,以确保所有配置的一致模型输入。 经验性后验揭示了一个关键的发现:尽管量子增强模型始终如一地获得更高的训练奖励,但它们在实际投资指标(如累积回报和夏普比率)中表现不佳。 这种差异凸显了将强化学习应用于金融领域的核心挑战 - 即代理奖励信号与真实投资目标之间的不匹配。 我们的分析表明,当前的奖励设计可能会激励过度适应短期波动,而不是优化风险调整后的回报。 这个问题因噪声中尺度量子(NISQ)约束下的量子电路固有的表现力和优化不稳定性而加剧。 我们讨论了这种奖励绩效差距的影响,并提出了未来改进的方向,包括奖励塑造,模型正则化和基于验证的早期停止。 我们的工作提供了一个可重复的基准和关键见解,以在实际金融中部署量子强化学习的实际挑战。

量子物理学机器学习计算金融学
arXiv

FinGPT:通过传播意识和上下文丰富的LLM增强基于情绪的股票运动预测

金融情绪分析对于理解新闻对股价的影响至关重要。 最近,由于其先进的文本分析能力,大型语言模型(LLM)已被广泛采用。 然而,这些模型通常只考虑新闻内容本身,而忽略了它的传播,这阻碍了对短期股票走势的准确预测。 此外,当前方法通常缺乏足够的上下文数据和提示中的明确说明,限制了LLM解释新闻的能力。 在本文中,我们提出了一种数据驱动的方法,通过结合新闻传播广度,上下文数据和明确的指示来增强基于LLM的情绪情绪的股票运动预测。 我们收集最近与公司相关的新闻,以评估其影响力和影响力,通过更具体的数据和精确的指示丰富提示。 这些数据用于构建指令调整数据集,以微调LLM用于预测短期股价走势。 我们的实验结果表明,与现有方法相比,我们的方法将预测精度提高了8%。

计算与语言机器学习计算金融学交易与市场微观结构
arXiv

LOB-Bench:Benchmarking Generative AI for Finance - 一种限制订单图书数据的应用程序

虽然由于高噪音、重尾和战略相互作用,财务数据提出了最具挑战性和最有趣的序列建模任务之一,但由于缺乏对定量评估范式的共识,这一领域的进展受到了阻碍。 为了解决这个问题,我们介绍了在python中实现的基准LOB-Bench,旨在评估LOBSTER格式的限序书(LOB)的生成式消息按顺序数据的质量和现实性。 我们的框架衡量生成和真实LOB数据之间的条件统计和无条件统计的分布差异,支持灵活的多变量统计评估。 该基准还包括常用的LOB统计数据,如传播,订单量,订单不平衡和消息到达时间,以及来自训练有素的判别器网络的分数。 最后,LOB-Bench包含“市场影响指标”,即数据中特定事件的交叉相关性和价格响应功能。 我们对生成式自动回归状态空间模型、(C)GAN 以及参数 LOB 模型进行基准测试,并发现自回归的 GenAI 方法击败了传统模型类。

机器学习计算工程、金融与科学计算金融学交易与市场微观结构
arXiv

QuantFactor REINFORCE:具有方差约束的REINFORCE的采矿稳定配方阿尔法因子

Alpha Factor Mining旨在从历史金融市场数据中发现投资信号,这些数据可用于预测资产回报并获得超额利润。 强大的替代因子挖掘深度学习方法缺乏可解释性,使它们在风险敏感的真实市场中不可接受。 公式化的阿尔法因子因其可解释性而优先,而搜索空间是复杂和强大的探索方法。 最近,提出了一个有前途的框架,用于使用深度强化学习生成公式化的α因子,并迅速获得了来自学术界和工业界的研究重点。 本文首先认为,最初采用的政策培训方法,即近端策略优化(PPO),在阿尔法因素挖掘的背景下面临几个重要问题。 在这里,提出了一种基于众所周知的REINFORCE算法的新型强化学习算法。 REINFORCE使用Monte Carlo抽样来估计政策梯度产生无偏见但高方差估计。 底层状态过渡函数固有的最小环境变异性,它坚持Dirac分布,可以帮助缓解这个高方差问题,使REINFORCE算法比PPO更合适。 一个新的专用基线旨在从理论上减少REINFORCE常见的高方差。 此外,信息比率作为一种奖励塑造机制,鼓励产生稳定的阿尔法因素,以更好地适应市场波动的变化。 对实际资产数据的评估表明,拟议的算法将收益与收益的相关性提高了3.83%,与最新的阿尔法因子挖掘方法相比,获得超额回报的能力更强,这很好地满足了理论结果。

计算金融学人工智能机器学习
arXiv

FinHEAR:金融决策的人类专业知识和自适应风险感知时间推理

财务决策为语言模型、要求时间推理、适应性风险评估和对动态事件的反应提出了独特的挑战。 虽然大型语言模型(LLM)表现出强大的一般推理能力,但它们往往无法捕捉人类财务决策的核心行为模式,例如专家依赖信息不对称,厌恶损失的敏感性和反馈驱动的时间调整。 我们提出了FinHEAR,一个人类专业知识和自适应风险感知推理的多代理框架。 FinHEAR 精心策划了专门的 LLM 代理,以分析历史趋势,解释当前事件,并在以事件为中心的管道中检索专家知情的先例。 它以行为经济学为基础,包括专家引导的检索,信心调整的位置大小和基于结果的改进,以提高可解释性和稳健性。 策划的财务数据集的实证结果表明,FinHEAR在趋势预测和交易任务方面的表现一直优于强基线,实现了更高的准确性和更好的风险调整后的回报。

机器学习人工智能计算金融学
arXiv

TIP-Search:不确定负载下市场预测的时间预测推断

本文提出了TIP-Search,这是一个时间可预测的推理调度框架,用于在不确定的工作负载下进行实时市场预测。 TIP-Search受到高频金融系统严格延迟需求的激励,从异构池中动态选择深度学习模型,旨在最大限度地提高预测准确性,同时满足每个任务的截止日期限制。 我们的方法将延迟和广义性能离线化,然后执行在线任务感知选择,而无需依赖显式输入域标签。 我们在三个现实世界的限制订单数据集(FI-2010,Binance BTC / USDT,LOBSTER AAPL)上评估TIP-Search,并证明它优于静态基线,满意度高达8.5。 我们的研究结果强调了TIP-Search在不确定性下稳健的低延迟财务推断的有效性。

人工智能机器学习系统与控制计算金融学
arXiv

解释风险:金融模型的公理风险归因

近年来,机器学习模型以高度复杂的黑箱结构为代价取得了巨大的成功。 通过使用公理归因方法,我们可以公平地分配每个特征的贡献,从而允许我们解释模型预测。 在金融等高风险领域,风险与平均预测同样重要。 在整个这项工作中,我们解决了以下风险归因问题:如何公平地分配具有数据模型的风险? 我们通过分析和经验示例证明,通过扩展Shapley价值框架可以很好地分配风险。

计算金融学机器学习机器学习 (统计)
arXiv