在许多金融预测问题中,单个单位(如贷款、债券或股票)的行为受到可观察单位级因素和宏观经济变量的影响,以及潜在的横断面效应的影响。 传统方法试图通过手工制作的摘要特征捕捉这些潜在效果。 我们提出了一个Set-Sequence模型,消除了对手工制作功能的需求。 Set 模型首先在每个时期学习共享的横截面摘要。 然后,序列模型会独立地摄取每个单元的摘要增强时间序列来预测其结果。 这两个组件在训练过程中通过任意集来共同学习。 我们的方法利用了横截面的设置性质,并且计算效率很高,相对于单位数量,线性时间生成集合摘要。 它还具有灵活性,允许使用现有的序列模型,并在推理时容纳可变数量的单位。 经验评估表明,我们的设定顺序模型显著优于股票回报预测和抵押贷款行为任务的基准。 代码将被释放。
准确可靠的日内电价概率预测对于管理市场不确定性和支持稳健的交易策略至关重要。 然而,当前的方法严重依赖域特征提取,无法捕捉买卖订单之间的动态,限制了形成订单簿丰富表示的能力。 此外,这些方法通常需要为不同的分位数训练单独的模型,并引入额外的程序,例如事后分位数排序或基于损失的处罚,以解决预测的上分位数低于下限的分位数问题。 这些步骤要么与模型训练解耦,要么引入额外的调谐复杂性。 为了应对这些挑战,我们提出了一种名为 OrderFusion 的编码方法,并设计了一个分层多量子化头。 OrderFusion将订单簿编码为2.5D表示,并使用量身定制的跳跃交叉注意力来模拟买卖动态,而无需域特征提取。 中位分位数头锚定和分层通过受限的残差估计其他分位数,确保单调性,无需后处理或附加调优。 我们使用德国和奥地利市场的三年订单数据对三个关键价格指数(ID1,ID2和ID3)进行了广泛的实验和消融研究。 结果表明,我们的方法为概率盘中价格预测提供了准确、可靠和统一的端到端框架。
波动性聚类是一个对股票市场模式产生重大影响的关键属性。 尽管如此,开发用于准确预测未来股价波动的稳健模型是一个艰难的研究课题。 为了预测在印度国家股票市场(NSE)上市的三只股票的波动性,我们根据广义的自动回归条件异质性(GARCH),Glosten-Jagannathan-GARCH(GJR-GARCH),指数通用自动回归条件异质性(EGARCH)和LSTM框架提出了多种波动性模型。 在我们的研究中选择了部门明智的股票。 已经考虑的行业是银行,信息技术(IT)和制药。 yahoo金融已用于获取2017年1月至2021年12月的股价数据。 在提取记录中,从2017年1月到2020年12月的数据已被用于培训,并且选择了2021年的数据来测试我们的模型。 通过实施三种不同类型的GARCH模型以及LSTM模型,对预测三个部门股票波动性的表现进行了评估。 据观察,LSTM在预测制药对银行和IT部门的波动性方面表现更好。 同时,也观察到E-GARCH在银行业和IT和制药方面表现更好,GJR-GARCH表现更好。
本文介绍并正式验证了使用精益4定理证明器在N维度中一阶随机支配(FSD)的新几何框架。 传统的多维随机支配分析方法在很大程度上依赖于复杂的测量理论和多变量微积分,为举证助手的形式化创造了重大障碍。 我们的几何方法通过直接比较右上角矫正者的生存概率来表征N维FSD,绕过了复杂融合理论的需要。 我们正式化了关键定义,并证明了传统FSD要求与我们的几何表征之间的等价性。 这种方法实现了更易于处理和直观的正式验证路径,同时保持数学严谨性。 我们展示了这个框架如何直接能够在投资组合选择、风险管理和福利分析中实现多维经济问题的正式分析。 这项工作为进一步发展经济和金融领域的经过验证的决策工具奠定了基础,特别是对于需要严格担保的高风险领域。
机器学习技术在实际市场中的部署有所增加。 在这项工作中,我们探讨了大型语言模型(LLM)在多商品市场中作为自主代理部署时的战略行为,特别是在Cournot竞争框架中。 我们研究LLM是否可以独立参与反竞争行为,如串通或更具体地说是市场划分。 我们的研究结果表明,LLM可以通过动态调整定价和资源分配策略来有效地垄断特定商品,从而在没有直接的人类投入或明确的串通命令的情况下最大限度地提高盈利能力。 这些结果为希望将人工智能整合到战略角色中的企业以及负责维护公平和竞争市场的监管机构带来了独特的挑战和机遇。 该研究为进一步探索将高风险决策推迟到基于LLM的代理商的后果奠定了基础。
通过分析收益电话会议记录来预测收益意外,引起了金融研究界的日益关注。 电话会议是公司高管、分析师和股东之间的关键沟通渠道,提供有价值的前瞻性信息。 然而,这些成绩单提出了重大的分析挑战,通常包含超过5,000个单词,具有大量的冗余和行业特定的术语,为语言模型创造了障碍。 在这项工作中,我们提出了用于财务代表性增强的Spalse Autoencoder(SAE-FiRE)框架,通过提取关键信息,同时消除冗余来解决这些限制。 SAE-FiRE使用Sarse Autoencoders(SAE)来有效地识别模式并过滤噪音,并专注于捕获具有预测能力的财务信号。 实验结果表明,拟议的方法可以显著优于比较基线。
本文探讨了使用深度学习长短期记忆(LSTM)模型进行准确的股价预测及其对投资组合设计的影响。 尽管有效的市场假设表明预测股价是不可能的,但最近的研究表明了高级算法和预测模型的潜力。 该研究建立在关于股价预测方法的现有文献的基础上,强调了向机器学习和深度学习方法的转变。 利用在印度NSE上市的18个板块的180只股票的历史股票价格,LSTM模型预测未来的价格。 这些预测指导每只股票的买入/卖出决策,并分析行业盈利能力。 该研究的主要贡献是三个方面:引入优化的LSTM模型,用于稳健的投资组合设计,利用LSTM对买入/卖出交易的预测,以及对行业盈利能力和波动性的见解。 结果证明了LSTM模型在准确预测股票价格和告知投资决策方面的功效。 通过比较行业盈利能力和预测准确性,这项工作为印度当前金融市场的动态提供了有价值的见解。
在本文中,我们介绍了Deep-MacroFin,这是一个旨在解决偏微分方程的综合框架,特别关注连续时间经济学中的模型。 该框架利用深度学习方法,包括多层感知器和新开发的Kolmogorov-Arnold网络。 它使用汉密尔顿 - 雅各比 - 贝尔曼(HJB)方程和耦合代数方程封装的经济信息进行优化。 与其他数值方法相比,神经网络的应用有望以更少的计算需求和限制来准确解决高维问题。 这个框架可以很容易地适应高维偏微分方程的系统。 重要的是,它提供了比现有库更高效(5×更少的CUDA内存和40×更少的FLOP)和用户友好的实现。 我们还采用时间步法方案,以提高非线性 HJB 方程的训练稳定性,从而解决 50D 经济模型。
我们提出了一个在不同固定收益产品类别的折扣曲线转移学习框架。 受从稀疏或嘈杂的数据估计折扣曲线的挑战激励,我们将内核脊回归(KR)扩展到矢量值设置,在矢量值复制内核Hilbert空间(RKHS)中制定凸优化问题。 解决方案的每个组件对应于特定产品类别所隐含的折扣曲线。 我们引入了一个以经济原则为动机的额外正则化术语,促进产品类之间价差曲线的平滑度,并表明它导致了有效的可分离内核结构。 一个主要的理论贡献是由可分离内核诱导的矢量值RKHS规范的分解。 我们进一步提供矢量值KR的高斯过程解释,实现估计不确定性的量化。 说明性示例表明,与单曲线估计相比,迁移学习显着提高了外推性能并收紧了置信区间。
高频交易(HFT)是一种投资策略,持续监控市场状态,并以毫秒级的速度进行竞价和下单。 传统的HFT方法将模型与历史数据相适应,并假设未来的市场状态遵循类似的模式。 这限制了任何单一模型的有效性,使其适应其所训练的特定条件。 此外,这些模型仅在特定市场条件下实现最佳解决方案,例如对股价随机过程的假设,稳定的订单流以及没有突然波动。 然而,现实世界的市场是动态的,多样化的,而且经常是不稳定的。 为了应对这些挑战,我们提出了FlowHFT,这是一个基于流程匹配策略的新型模仿学习框架。 FlowHFT同时从众多专家模型中学习策略,每种模型都精通特定的市场场景。 因此,我们的框架可以根据当前的市场状态进行适应性调整投资决策。 此外,FlowHFT还采用了网格搜索微调机制。 这使得它能够细化策略并实现卓越的性能,即使在专家策略可能不理想的复杂或极端市场场景中也是如此。 我们在多个市场环境中测试 FlowHFT。 我们首先表明,流量匹配策略适用于随机市场环境,从而使FlowHFT能够在不同的市场条件下学习交易策略。 值得注意的是,我们的单一框架始终如一地在每个市场条件下都能超越最佳专家的性能。
期权定价通常需要求解偏微分方程(PDE)。 尽管基于深度学习的PDE求解器最近已成为这个问题的快速解决方案,但它们的经验和定量准确性仍然没有得到很好的理解,阻碍了它们的实际适用性。 在这项研究中,我们的目标是提供可操作的见解,了解深度PDE求解器在实际期权定价实施方面的效用。 通过Black-Scholes和Heston模型的比较实验,我们评估了两种神经网络算法解决PDE的经验性能:Deep Galerkin方法和Time Deep Gradient Flow方法(TDGF)。 我们确定它们的经验收敛率和训练时间作为(i)采样阶段数,(ii)样本数量,(iii)层数,以及(iv)每层节点数。 对于TDGF,我们还考虑离散方案的顺序和时间步骤的数量。
我们研究了默顿在不完整市场中的预期效用最大化问题,其特征是除了股价过程之外的一个因素过程,其中所有模型原语都是未知的。 正在考虑的代理人是价格接受者,只能访问股票和要素价值过程以及瞬时波动。 我们提出了一个辅助问题,其中代理可以根据特定类别的高斯分布调用策略随机化,并证明其最优高斯策略的均值解决了最初的默顿问题。 通过随机化策略,我们正处于最近由Wang等人开发的连续时间强化学习(RL)领域。 (2020)和Jia和Zhou(2022a,2022b,2023),使我们能够以数据驱动的方式解决辅助问题,而无需估计模型原语。 具体来说,我们建立了一个策略改进定理,在此基础上,我们设计在线和离线演员-评论家RL算法,用于学习默顿的策略。 这项研究的一个关键见解是,RL,特别是政策随机化,除了探索的目的之外,它们是有用的 - 它们可以作为技术工具来解决一个不能仅仅通过确定性政策解决的问题。 最后,我们在随机波动环境中进行模拟和实证研究,以证明设计中的RL算法与传统基于模型的插件方法相比具有决定性的表现。
提出了一种新的深度学习神经网络架构,基于随机微分方程(SDE)的高阶弱近似算法。 该架构通过深度学习模型实现了对马厩的高效学习。 研究了基于这种架构的深度神经网络的行为,当应用于金融衍生品定价问题时。 这个新架构的核心在于显式Runge-Kutta类型的高阶弱近似算法,其中近似仅通过目标SDE的迭代组合和矢量字段的线性组合来实现。
我们研究了Q-learning for reinforcement Learning(RL)的连续时间对应物,由Wang等人介绍的熵规范化,探索性扩散工艺配方。 (2020年)。 随着常规(大)Q函数在连续的时间内崩溃,我们考虑其一阶近似值并硬币为术语“(little)q-function”。 此功能与瞬时优势率函数以及Hamiltonian有关。 我们围绕q函数发展了一个独立于时间离散的“q-learning”理论。 鉴于随机策略,我们通过某些随机过程的马厩条件,在政策上和非政策设置中共同表征相关的q函数和值函数。 然后,我们将该理论应用于设计不同的 actor-critic 算法来解决潜在的 RL 问题,这取决于是否可以显式计算从 q 函数生成的 Gibbs 度量的密度函数。 我们的一个算法解释了著名的Q-学习算法SARSA,另一个算法恢复了在Jia和Zhou(2022b)中提出的基于策略梯度(PG)的连续时间算法。 最后,我们进行模拟实验,将我们的算法与Jia和Zhou(2022b)中基于PG的算法和时间离散的常规Q学习算法的性能进行比较。
这本博士论文通过三个相互关联的作品探讨了Heston随机波动模型的近似和规律性。 这项工作的重点是为Cox-Ingersoll-Ross(CIR)过程开发高阶弱近似,这对于财务建模至关重要,但由于方根扩散术语阻止标准方法而具有挑战性。 通过使用基于Alfonsi(2010)二阶方案的随机网格技术(Alfonsi Bally,2021),这项工作证明,任何顺序的弱近似都可以实现平滑测试功能。 这在一个比著名的费勒的限制条件下。 数字结果证实了CIR和Heston模型的收敛,并显示出显著的计算时间改进。 第二个工作将随机网格技术扩展到log-Heston过程。 引入了两个二阶方案(一个使用精确的波动率模拟,另一个使用Ninomiya-Victoir在以上使用的相同限制下分裂)。 对任何期望的秩序的趋同都得到了严格的证明。 数字实验验证了方案对欧洲和亚洲期权定价的有效性,并提出了对多因素/粗糙的Heston模型的潜在适用性。 第三个工作研究与log-Heston模型相关的偏微分方程(PDE)。 它扩展了经典的解决方案结果,并在不依赖于Feller条件的情况下建立了粘度解决方案的存在和独特性。 即使对于某些不连续的初始数据,也证明了独特性,这些数据与数字期权等定价工具相关。 此外,混合数值方案与粘度解决方案的收敛性在初始数据的松动规律性(连续性)下显示。 附录包括CIR进程的补充结果。
自从生成式人工智能问世以来,每家公司和研究人员都急于开发自己的生成模型,无论是否商业。 鉴于这些强大的新工具的大量用户,目前没有内在可验证的方法来从头开始解释当LLM(大型语言模型)学习时会发生什么。 例如,那些基于自动语音识别系统,它们必须依靠从网络上收集的庞大和天文数字的数据来产生快速高效的结果,在这篇文章中,我们开发了一种名为MarketBackFinal 2.0的后门攻击,基于声学数据中毒,MarketBackFinal 2.0主要基于现代股票市场模型。 为了显示可能依赖LLM的基于语音的变压器可能存在的脆弱性。
随着语音激活系统和语音识别技术的日益使用,对音频数据进行后门攻击的危险显著增加。 这项研究着眼于一种特定类型的攻击,称为基于随机投资的后门攻击(MarketBack),其中对手战略性地操纵音频的风格属性来愚弄语音识别系统。 机器学习模型的安全性和完整性受到后门攻击的严重威胁,为了保持音频应用程序和系统的可靠性,在音频数据的背景下,识别此类攻击变得至关重要。 实验结果表明,当中毒小于1时,MarketBack在7个受害者模型中的平均攻击成功率接近100是可行的。
有效的股价预测(估计未来价格)和预测(估计未来价格变化)对投资者、监管机构和政策制定者至关重要。 这些任务可实现明智的决策、风险管理、战略规划和卓越的投资组合回报。 尽管它们很重要,但由于股价数据的动态性质,预测和预测具有挑战性,这些数据在分布和统计性质上表现出显着的时间差异。 此外,虽然预测和预测目标都来自同一个数据集,但它们的统计特征差异很大。 预测目标通常遵循日志正态分布,其特征是平均和方差随时间的显着变化,而预测目标则坚持正态分布。 此外,尽管与单步方法相比,多步骤预测和预测提供了更广阔的视角和更丰富的信息,但由于累积误差和长期时间差异等因素,它更具挑战性。 因此,以前的许多作品都解决了单步股价预测或预测问题。 为了解决这些问题,我们引入了一种称为 Patched Channel Integration Encoder (PCIE) 的新模型,以解决股价预测和预测。 在这个模型中,我们利用涵盖历史价格和价格变化的多个股票渠道,并设计一种新的代币化方法,以跨渠道和时间高效的方式有效地嵌入这些渠道。 具体来说,令牌化过程涉及使用通道混合编码器进行单变量修补和时间学习,以减少累积错误。 全面的实验证实PCIE在预测和预测任务中优于当前最先进的模型。
在金融市场日益动荡的环境中,准确估计风险仍然是一个重大挑战。 传统的计量经济学模型,如GARCH及其变体,是基于通常过于僵化而无法适应当前市场动态复杂性的假设。 为了克服这些限制,我们提出了一个价值风险(VaR)估计的混合框架,将GARCH波动率模型与深度强化学习相结合。 我们的方法结合了使用双深Q-Network(DDQN)模型的方向性市场预测,将任务视为不平衡的分类问题。 这种架构能够根据市场情况动态调整风险水平预测。 每日Eurostoxx 50数据的经验验证涵盖了危机和高波动期,表明VaR估计的准确性显着提高,以及违规行为数量和资本要求减少,同时尊重监管风险阈值。 该模型实时调整风险水平的能力加强了其与现代和主动风险管理的相关性。
我们介绍了深度多FBSDE方法,用于对耦合的向前向后微分方程(FBSDE)进行稳健近似,重点关注Han,Jentzen和E(2018)的深层BSDE方法未能收敛的情况。 为了克服收敛问题,我们考虑一个FBSDE家族,它们相当于原始问题,因为它们满足了相同的相关偏微分方程(PDE)。 我们的算法分为两个阶段:第一,我们近似FBSDE家族的初始条件,第二,我们使用第一阶段近似的初始条件来近似原始FBSDE。 数字实验表明,即使标准深度BSDE方法没有,我们的方法也会收敛。