定量金融学
Quantitative Finance
计算金融学
Computational Finance
金融经济学
Economics
通用金融学
General Finance
我们提出了一个无梯度的在线集成学习算法,该算法根据它们最近的预测性能,动态地结合一组来自异构机器学习模型的预测,通过样本外的R-squared进行测量。 集合是不可模型无关的,不需要梯度访问,并且设计用于非静态下的顺序预测。 它自适应地重新加权16个组成模型 - 三个线性基准(OLS,PCR,LASSO)和13个非线性学习者,包括随机森林,梯度提升树和神经网络层次结构(NN1-NN12)。 我们将框架应用于部门轮换,使用从公司特征汇总的部门级特征。 经验上,部门回报比个人资产回报更可预测和稳定,使其适合横断面预测。 该算法构建了特定扇区集成,以滚动窗口方式分配自适应权重,并以预测准确性为指导。 我们的关键理论结果将在线预测直接归因于实现样本外R-squared,提供了一个可解释的保证,即合奏在事后的表现几乎和最好的模型一样好。 表面上看,该组合的表现始终优于单个模型、同等加权平均值和传统离线集成,在宏观经济体系中(包括COVID-19危机期间)提供更高的预测准确性、更强的风险调整回报和稳健性。
时间序列预测在金融领域很重要。 财务时间序列(TS)模式受到短期公众意见和中期/长期政策和市场趋势的影响。 因此,处理多周期投入对于准确的财务时间序列预测(TSF)至关重要。 然而,目前的TSF模型要么只使用单周期输入,要么缺乏用于解决多周期特征的定制设计。 在本文中,我们提出了一个多周期学习框架(MLF),以提高财务TSF绩效。 MLF考虑TSF的精度和效率要求。 具体来说,我们设计三个新模块以更好地集成多周期输入以提高准确性:(i) 周期间冗余过滤(IRF),用于精确自我关注建模,(ii)可学习加权平均集成(LWI),有效集成多周期预测,(iii)多周期自适应修补(MAP),通过设置相同的时间段来减轻对特定周期的偏差。 此外,我们提出了一个 Patch Squeeze 模块,以减少自注意力建模中的补丁数量,以实现最大化的效率。 MLF包含多个不同长度(周期)的输入,以实现更好的精度,并降低训练期间选择输入长度的成本。 代码和数据集可在https://github.com/Meteor-Stars/MLF上找到。
我们研究了一些人工神经网络架构(众所周知的、更“异国情调”)应用于不同全球市场指数的长期财务时间序列预测。 这项研究特别感兴趣的领域是研究这些索引在机器学习算法交叉训练方面的行为的相关性。 当将这种模型应用于预测来自不同市场的指数时,从一个全球市场对指数进行训练是否会产生类似甚至更好的准确性? 对这个问题的证明主要是肯定的回答是支持尤金·法马(Eugene Fama)长期争论的高效市场假说的另一个论点。
虽然大型语言模型已被用于生成可解释的股票预测,但它们主要集中在分析文本报告而不是历史价格数据,也称为技术分析。 这项任务具有挑战性,因为它在域之间切换:股价输入和输出位于时间序列域中,而推理步骤应该是自然语言。 在这项工作中,我们引入了口头技术分析(VTA),这是一个新颖的框架,结合了口头和潜在推理,可以产生既准确又可解释的股票时间序列预测。 为了推理时间序列,我们将股价数据转换为文本注释,并使用反向平均方块误差(MSE)奖励目标优化推理跟踪。 为了从文本推理中产生时间序列输出,我们将时间序列主干模型的输出与基于推理的属性进行调节。 美国、中国和欧洲市场对股票数据集的实验表明,VTA实现了最先进的预测准确性,而推理痕迹在行业专家的评估中也表现良好。
我们研究BTC-USD限价账簿(LOB)固定期限的机会最优清算。 我们介绍了RL-Exec,一种经过历史重播训练的PPO代理,增加了内源性瞬态冲击(弹性),部分填充,制造商/获取者费用和延迟。 该政策观察到深度-20 LOB特征加上微观结构指标,并在仅销售库存限制下采取行动,以达到剩余目标。 评估遵循严格的时间分割(火车:2020年1月;测试:2月2020年)和每日协议:每个测试日,我们运行十个独立开始时间,并汇总到一个单一的每日得分,避免伪复制。 我们将代理与(i)TWAP和(ii)使用相反订单簿流动性(前20级)的类似VWAP的基线分配进行比较,两者都在相同的时间戳和成本上执行。 统计推理使用单面Wilcoxon签名级测试,每日RL基线差异与Benjamini-Hochberg FDR校正和引导置信区间。 在2月2020日的测试中,RL-Exec大大优于基线,差距随执行视界增加(30分钟时+2-3 bps,60分钟+7-8 bps,120分钟+23 bps)。 代码: github.com/Giafferri/RL-Exec
我们向美国首次申请联邦学习(FL)。 国家金融能力研究,引入了一个可解释的框架,用于预测所有50个州和哥伦比亚特区的消费者财务困境,而无需集中敏感数据。 我们的跨筒仓FL设置将每个州视为一个独特的数据孤岛,模拟全国金融体系中的实际治理。 与之前的工作不同,我们的方法集成了两种可解释的人工智能技术,以确定全球(全国)和地方(特定国家)的财务困难预测因素,例如债务收集机构的接触。 我们开发了一个专门用于高度分类、不平衡的调查数据的机器学习模型。 这项工作为金融早期预警系统提供了一个可扩展的、符合监管标准的蓝图,展示了FL如何在消费者信用风险和金融包容性方面为对社会负责的人工智能应用提供动力。
金融业对高级自然语言处理(NLP)能力的需求不断增长,突显了通用大型语言模型(LLM)在处理特定领域财务任务方面的局限性。 为了解决这一差距,我们推出了LLM Pro Finance Suite,这是专门为金融应用设计的5个指令调谐的LLM(从8B到70B参数)。 我们的方法侧重于增强通才指导调整模型,利用其在教学遵循,推理和毒性控制方面的现有优势,同时在策划的高质量金融语料库上微调,包括超过50%的英语,法语和德语金融相关数据。 我们评估LLM Pro金融套件的综合财务基准套件,在面向金融的任务和金融翻译方面显示出对最先进的基线的一致改进。 值得注意的是,我们的模型保持了其基础模型的强大通用域功能,确保了非专业任务的可靠性能。 这种双重熟练程度,增强的财务专业知识,而不会在一般能力上妥协,使LLM Pro Finance Suite成为财务工作流程中现有LLM的理想替代品,提供改进的特定领域性能,同时保持整体多功能性。 我们公开发布两个8B参数模型,以促进金融NLP应用的未来研究和开发:https://huggingface.co/collections/DragonLLM/llm-open-finance。
电价预测已成为能源市场决策的关键工具,特别是随着可再生能源渗透率的增加带来更大的波动性和不确定性。 从历史上看,该领域的研究一直以点预测方法为主,该方法提供单值预测,但未能量化不确定性。 然而,随着电力市场的发展,由于可再生能源集成,智能电网和监管变化,对概率预测的需求变得更加明显,为风险评估和市场参与提供了更全面的方法。 本文介绍了概率预测方法的回顾,通过分位数回归技术,从贝叶斯和基于分布的方法,追踪到构象预测的最新发展。 特别强调概率预测的进步,包括以有效性为重点的方法,解决不确定性估计的关键限制。 此外,该审查超越了“未来日”市场,包括日内和平衡市场,其中预测挑战因更高的时间粒度和实时操作限制而加剧。 我们研究最先进的方法,关键评估指标和持续挑战,如预测有效性,模型选择和缺乏标准化基准,为研究人员和从业者提供全面和及时的资源,以驾驭现代电力市场的复杂性。
在p时滞上运行的基本递归神经网络,称为RNN(p),是线性自回归模型ARX(p)的自然概括。 它是用于在多个时间尺度上显示固有季节性模式的变量的强大预测工具,正如在能源、经济和金融时间序列中经常观察到的那样。 RNN(p)模型的架构,以跨时间滞后的结构化反馈为特征,能够设计高效的培训策略。 我们对这些模型的学习算法进行了比较研究,对其计算复杂性和培训性能进行了严格的分析。 我们介绍了RNN(p)模型在电力消耗预测中的两种应用,这是能源领域的一个关键领域,其中准确的预测为运营和财务决策提供信息。 实验结果表明,RNN(p)模型在保持高度可解释性的同时,实现了出色的预测精度。 这些功能使其非常适合能源市场和其他金融科技应用的决策,在这些应用中,可靠的预测起着重要的经济作用。
我们记录了像ChatGPT这样的大型语言模型(LLM)在没有直接财务培训的情况下预测新闻标题的股市反应的能力。 使用知识后切断标题,GPT-4捕获了最初的市场反应,为不可交易的初始反应实现了约90%的投资组合日命中率。 GPT-4得分也显着预测了随后的漂移,特别是对于小股和负面消息。 预测能力通常随着模型大小而增加,这表明财务推理是复杂LLM的新兴能力。 随着LLM采用率的上升,战略回报下降,与提高价格效率一致。 为了理顺这些发现,我们开发了一个理论模型,该模型结合了LLM技术,信息处理能力限制,反应不足和套利限制。
尽管占马来西亚所有企业的96.1%,但获得融资仍然是微型、小型和中型企业(MSME)面临的最持久的挑战之一。 新成立的或年轻的企业往往被排除在正规信贷市场之外,因为传统的承保方法严重依赖信贷局的数据。 这项研究调查了银行对账单数据作为信贷评估的替代数据源的潜力,以促进新兴市场的金融包容性。 首先,我们提出了一个基于现金流的承保管道,利用银行对账单数据进行端到端数据提取和机器学习信用评分。 其次,我们介绍了来自马来西亚贷款机构的611名贷款申请人的新数据集。 第三,我们根据应用信息和银行交易衍生功能开发和评估信用评分模型。 经验结果表明,使用这些数据可以提高我们数据集上所有模型的性能,从而提高新贷款中小微企业的信用评分。 最后,我们打算发布匿名银行交易数据集,以促进对马来西亚新兴经济体中小微企业金融包容性的进一步研究。
这项研究提出了一个三步机器学习框架,通过将金融新闻情绪与宏观经济指标相结合来预测S P 500股票市场的泡沫。 在传统的计量经济学方法的基础上,拟议的方法通过整合文本和定量数据源来预测气泡的形成。 在第一步中,使用右尾单位根测试(一种广泛认可的实时气泡检测方法)来识别S P 500指数中的气泡周期。 第二步使用自然语言处理(NLP)技术从大型金融新闻文章中提取情绪特征,这些技术捕捉投资者的期望和行为模式。 在最后一步,集成学习方法应用于基于高情绪和宏观经济预测因子预测泡沫发生。 模型性能通过k倍交叉验证进行评估,并与基准机器学习算法进行比较。 实证结果表明,拟议的三步集成方法显着提高了预测准确性和稳健性,为投资者,监管机构和政策制定者在缓解系统性金融风险方面提供了宝贵的预警见解。
这项研究提出了一种用于预测比特币价格的混合深度学习模型,因为众所周知,数字货币表现出频繁的波动。 所使用的模型是变频模式分解(VMD)和长短期内存(LSTM)网络。 首先,VMD用于将原始比特币价格序列分解为内在模式功能(IMF)。 然后,每个IMF都使用LSTM网络建模,以更有效地捕获时间模式。 货币基金的个人预测汇总,以产生原始比特币价格系列的最终预测。 为了确定拟议混合模型的预测功率,对标准LSTM进行了比较分析。 结果证实,混合VMD+LSTM模型在所有评估指标(包括RMSE,MAE和R2)中均优于标准LSTM,还提供了可靠的30天预测。
本研究介绍了对外汇市场价格变动的短期预测系统,使用市场深度数据和系统程序来实现完全自动化的交易系统。 该案例研究的重点是英国在世界领先的博彩交易所 Betfair 的预生活阶段赢得赛马市场。 创新的卷积注意力机制被引入并应用于多个循环神经网络和二维卷积循环神经网络层。 此外,还提出了一种新的卷积层填充方法,专门用于多变量时间序列处理。 这些创新非常详细,以及它们的执行过程。 拟议的架构遵循标准的监督学习方法,涉及模型培训和随后对新数据的测试,这需要广泛的预处理和数据分析。 该研究还为自动化功能工程和市场交互提供了一个完整的端到端框架,使用生产中开发的模型。 这项研究的关键发现是,所有提出的创新都积极影响了正在审查的分类任务的性能指标,从而推进了目前应用于多变量时间序列问题的卷积注意力机制和填充方法的最先进的方法。
这项研究提出了自动做市商(AMM)和分散式金融(DeFi)交易策略中的量子机器学习(QML)和经典机器学习(CML)方法之间的全面经验比较,通过对多个加密货币资产的10个模型进行广泛的背对测试。 我们的分析包括经典的ML模型(Random Forest,Gradient Boosting,Logistic Regression),纯量子模型(VQE分类器,QNN,QSVM),混合量子经典模型(QASA Hybrid,QASA Sequence,QuantumRWKV)和变压器模型。 结果表明,混合量子模型以11.2%的平均回报率和1.42的平均夏普比实现了卓越的整体性能,而经典的ML模型则显示了9.8%的平均回报率和1.47的平均夏普比。 QASA序列混合模型实现了13.99%的最高个人回报率,最佳夏普比为1.76,证明了量子经典混合方法在AMM和DeFi交易策略中的潜力。
本文介绍了大型语言模型(LLM)在金融市场新闻情绪分析任务中的比较研究。 这项工作旨在分析这些模型在财务背景下这一重要的自然语言处理任务的性能差异。 LLM模型与经典方法进行比较,允许量化每个测试模型或方法的好处。 结果表明,大型语言模型在绝大多数情况下优于经典模型。
股票市场错综复杂的动态导致了对能够有效解释其内在复杂性的模型的广泛研究。 这项研究利用计量经济学文献来探索动态因子模型,作为一个可解释的模型,具有足够的预测能力,可以捕捉基本的市场现象。 虽然该模型已广泛应用于预测目的,但本研究侧重于分析提取的负载和常见因素,作为理解股价动态的替代框架。 这些结果揭示了使用卡尔曼方法和最大可能性估计应用于菲律宾证券交易所时对传统市场理论的新见解,随后对资本资产定价模型进行了验证。 值得注意的是,一因素模型提取了代表与复合指数相似的系统或市场动态的共同因素,而双因素模型提取代表市场趋势和波动性的共同因素。 此外,现在预测菲律宾国内生产总值增长率的模型的应用突出了提取的共同因素作为可行的实时市场指标的潜力,导致样本外预测误差减少了34%以上。 总体而言,结果强调了动态因素分析在更深入地了解市场价格变动动态方面的价值。
大多数财务推荐系统往往无法解释关键的行为和监管因素,导致建议与用户偏好不一致,难以解释或不太可能遵循。 我们介绍了FLARKO(金融语言模型资产推荐与知识图谱优化),一个集成大型语言模型(LLM),知识图谱(KG)和卡尼曼 - 特弗斯基优化(KTO)的新框架,以生成既盈利又符合行为的资产建议。 FLARKO将用户的交易历史和资产趋势编码为结构化KG,为LLM提供可解释和可控的上下文。 为了证明我们方法的适应性,我们开发和评估集中架构(CenFLARKO)和联合变体(FedFLARKO)。 据我们所知,这是KTO首次展示将KTO用于微调LLM进行金融资产推荐。 我们还首次使用结构化KG来在联合学习(FL)环境中对行为金融数据进行LLM推理。 在FAR-Trans数据集上进行了评估,FLARKO在行为调整和联合盈利能力方面始终优于最先进的推荐基线,同时保持可解释和资源效率。
日本和美国主要市场指数,NIKKEI 225和纳斯达克综合指数以及JPY / DEM和DEM / USD货币汇率的概率分布的演变通过福克 - 普朗克方程(FPE)来描述。 为了区分和量化对这些财务时间序列的确定性和随机影响,我们对它们不同时间滞后Δ(t)的增量Δ(t)分布函数进行统计分析。 从各种 Δ(t) 的概率分布函数来看,明确地导出了 p(Δ x(t) 的 Fokker-Planck 方程。 它是用漂移和扩散系数写成的。 Kramers-Moyal系数被估计并发现具有简单的分析形式,因此对漂移D^(1)和扩散D^(2)系数进行了简单的物理解释。 显示了指数和汇率的马尔可夫性质,并指出了纳斯达克D^(2)的明显差异。
时间序列分析中的多分差表征了多个缩放指数的存在,表明除了简单的单分形模型之外,异质的时间结构和复杂的动态行为。 在数字货币市场的背景下,多股属性是由于远程时间相关性和重尾回报分布的相互作用而产生的,反映了复杂的市场微观结构和交易者互动。 将多分量分析纳入加密货币价格动态建模,可增强对市场低效率的理解,可以改善波动性预测,并促进关键过渡或制度转变的检测。 基于多分法交叉相关性分析(MFCCA),其空间案例是多分量脱向波动分析(MFDFA),作为量化多分法最常用的实用工具,在目前的贡献中,最近提出的在时间序列中将多分法源解藻的方法应用于数字市场最具代表性的仪器。 它们包括比特币(BTC),以太坊(ETH),去中心化交易所(DEX)和不可替代的代币(NFT)。 结果表明重尾在产生广泛的多分光谱方面的重要作用。 然而,它们也清楚地表明,多分性的主要来源是系列中的时间相关性,如果没有它们,多分性就会消失。 这些时间相关性在很大程度上并不取决于波动分布的尾巴的厚度。 这些观察是在数字货币市场的背景下提出的,为在时间序列中分离多分法来源的拟议方法的有效性提供了进一步有力的论据。
继续滚动加载更多