AI基础研究具身智能 AI金融

本网站上的内容仅供参考，不提供医疗或其他专业建议，不代表活水快报、贡献者或合作伙伴的观点。

© 2024-2025 活水快报 - 42Digest.

|

京ICP备2024044642号-15

AI金融研究快报

相关分类

人工智能

Artificial Intelligence

定量金融学

Quantitative Finance

计算金融学

Computational Finance

金融经济学

Economics

人工智能

Artificial Intelligence

定量金融学

Quantitative Finance

计算金融学

Computational Finance

金融经济学

Economics

最新研究

TeVAE:用于在变量状态多变量时间序列数据中离散在线异常检测的变量自动编码器方法

随着对记录数据的关注在汽车测试和手动评估领域达到极限,对自动在线异常检测的需求越来越大。这种真实世界的数据在许多方面是复杂的,需要对被试者的行为进行建模。为了解决这个问题,我们提出了一个时间变异自动编码器(TeVAE),它可以在未标记的数据上训练时以最小的误报检测异常。我们的方法也避免了旁路现象,并引入了一种新的方法,将单个窗口重新映射到连续的时间序列。此外,我们提出了评估我们方法的检测延迟和根本原因能力的指标,并介绍了现实世界工业数据集实验的结果。如果正确配置,TeVAE标记的异常值只有6%的时间是错误的,并检测65%的异常存在。它还具有在较小的训练和验证子集方面表现良好的潜力,但需要更复杂的阈值估计方法。

机器学习人工智能计算工程、金融与科学

大型语言模型在再保险中的审慎可靠性:治理、保证和资本效率

本文为评估再保险中大型语言模型(LLM)的可靠性制定了审慎框架。五支柱架构 - 治理,数据谱系,保证,弹性和监管调整 - 将来自偿付能力II,SR 11-7的监督期望以及EIOPA(2025),NAIC(2023)和IAID(2024)的指导转化为可测量的生命周期控制。该框架通过再保险AI可靠性和保证基准(RAIRAB)实施,该基准评估治理嵌入式LLM是否符合接地,透明度和问责制的审慎标准。在六个任务家族中,检索接地配置实现了更高的接地精度(0.90),减少了大约40%的幻觉和解释漂移,透明度几乎翻了一番。这些机制降低了风险转移和资本配置中的信息摩擦,表明现有的审慎理论在治理明确、数据可追溯和保证可验证时已经适应了可靠的人工智能。

人工智能机器学习通用经济学金融经济学

通过微调蛋白语言模型和树木搜索促进硅内定向进化

通过氨基酸序列突变的蛋白质进化是生命科学的基石。虽然目前的硅内定向进化算法专注于设计搜索策略,但他们忽略了如何利用编码丰富进化模式的变革性蛋白质语言模型来指导搜索。为了弥补这一差距,我们提出了AlphaDE,这是一个通过利用大型语言模型的创新范式来进化蛋白质序列的新框架。首先,AlphaDE使用同源蛋白质序列上的掩蔽语言建模来调整预训练的蛋白质语言模型,以激活感兴趣的蛋白质类的进化合理性。其次,AlphaDE引入了基于蒙特卡洛树搜索的测试时间推断,该推理通过微调蛋白质语言模型的进化指导有效地进化蛋白质。广泛的基准实验表明,即使很少进行微调,AlphaDE也大大优于以前的最先进的方法。一项有趣的案例研究进一步表明,AlphaDE支持通过计算进化来凝聚蛋白质序列空间。

人工智能计算工程、金融与科学

财务时间序列预测的多期学习

时间序列预测在金融领域很重要。财务时间序列(TS)模式受到短期公众意见和中期/长期政策和市场趋势的影响。因此,处理多周期投入对于准确的财务时间序列预测(TSF)至关重要。然而,目前的TSF模型要么只使用单周期输入,要么缺乏用于解决多周期特征的定制设计。在本文中,我们提出了一个多周期学习框架(MLF),以提高财务TSF绩效。 MLF考虑TSF的精度和效率要求。具体来说,我们设计三个新模块以更好地集成多周期输入以提高准确性:(i) 周期间冗余过滤(IRF),用于精确自我关注建模,(ii)可学习加权平均集成(LWI),有效集成多周期预测,(iii)多周期自适应修补(MAP),通过设置相同的时间段来减轻对特定周期的偏差。此外,我们提出了一个 Patch Squeeze 模块,以减少自注意力建模中的补丁数量,以实现最大化的效率。 MLF包含多个不同长度(周期)的输入,以实现更好的精度,并降低训练期间选择输入长度的成本。代码和数据集可在https://github.com/Meteor-Stars/MLF上找到。

统计金融学人工智能机器学习

推理时间序列进行金融技术分析

虽然大型语言模型已被用于生成可解释的股票预测,但它们主要集中在分析文本报告而不是历史价格数据,也称为技术分析。这项任务具有挑战性,因为它在域之间切换:股价输入和输出位于时间序列域中,而推理步骤应该是自然语言。在这项工作中,我们引入了口头技术分析(VTA),这是一个新颖的框架,结合了口头和潜在推理,可以产生既准确又可解释的股票时间序列预测。为了推理时间序列,我们将股价数据转换为文本注释,并使用反向平均方块误差(MSE)奖励目标优化推理跟踪。为了从文本推理中产生时间序列输出,我们将时间序列主干模型的输出与基于推理的属性进行调节。美国、中国和欧洲市场对股票数据集的实验表明,VTA实现了最先进的预测准确性,而推理痕迹在行业专家的评估中也表现良好。

统计金融学人工智能机器学习计算金融学

数据驱动的Feynman-Kac发现与预测和数据生成的应用程序

在本文中,我们提出了一种新的数据驱动框架,用于发现Feynman-Kac公式背后的概率定律。具体来说,我们介绍了在风险中性概率度量下制定的第一个随机SINDy方法,从单对股票和期权轨迹中恢复向后随机微分方程(BSDE)。与识别通常需要符合人体工学的随机微分方程的现有方法不同,我们的框架利用了风险中立措施,从而消除了人体工学假设,并使BSDE从有限的财务时间序列数据中恢复。使用这种算法,我们不仅可以进行前瞻性预测,还可以生成与底层概率定律一致的新合成数据路径。

数理金融学人工智能计算金融学

CometNet:上下文动机引导的长期时间序列预测

长期时间序列预测在许多关键领域至关重要,但其准确性仍然受到现有模型中可接受现场瓶颈的根本限制。基于主流的Transformer和多层感知器(MLP)方法主要依赖于有限的回顾窗口,限制了它们模拟长期依赖的能力并损害了预测性能。天真地扩展回顾窗口被证明是无效的,因为它不仅引入了令人望而却步的计算复杂性,而且还淹没了历史噪音中重要的长期依赖性。为了应对这些挑战,我们提出了CometNet,这是一个新颖的上下文动机引导的长期时间序列预测框架。 CometNet首先引入了一个上下文动机提取模块,该模块从复杂的历史序列中识别循环的,占主导地位的上下文主题,提供了远远超过有限回顾窗口的广泛时间依赖; 随后,提出了Motif引导预测模块,该模块将提取的主要主题集成到预测中。通过动态将回顾窗口映射到其相关主题,CometNet有效地利用他们的上下文信息来加强长期预测能力。 8个真实世界数据集的广泛的实验结果表明,CometNet明显优于当前最先进的(SOTA)方法,特别是在扩展的预测视野方面。

计算工程、金融与科学人工智能

算法建议作为竞争市场的战略信号

随着算法越来越多地介导竞争决策,其影响力超越了个人成果,扩展到塑造战略市场动态。在两项预先注册的实验中,我们研究了算法建议如何影响经典经济游戏中人类行为,具有独特的,非串通和分析可追溯的均衡。在实验1(N = 107)中,参与者通过个性化或集体算法建议进行了伯特兰价格竞争。最初,串通向上偏到的建议提高了价格,特别是在个性化时,但价格在实验过程中逐渐趋同到平衡。然而,在整个实验过程中,参与者避免将价格置于算法的建议之上,这表明建议是可接受的价格的软上限。在实验2(N = 129)中,参与者与均衡对齐或战略上偏颇的算法建议进行了Cournot数量竞争。在这里,个性化的均衡建议支持稳定的收敛,而串通向下偏移的建议导致持续的生产不足和超竞争的利润 - 默契勾结的标志。在这两个实验中,参与者对个性化建议的反应比集体建议更强烈,更一致,这可能是由于对前者的更大感知所有权。这些发现表明,算法建议可以作为战略信号,即使没有明确的沟通,也会形成协调。这些结果呼应了现实世界对算法串通的担忧,并强调了在竞争环境中对算法决策支持系统进行仔细设计和监督的必要性。

人机交互人工智能计算机与社会计算机科学与博弈论

解释无法解释:金融中可解释的AI的系统回顾

从业者和研究人员试图在财务交界处的准确性和透明度中心 Explainable Artificial Intelligence (XAI)之间取得平衡。本文全面概述了XAI在金融领域应用的变化场景,以及特定领域的实施,方法论发展和研究趋势映射。使用书目和内容分析,我们发现主题集群,重要的研究,以及最常用于金融行业的解释性策略。我们的结果表明,对后临时可解释性技术有很大的依赖性;注意力机制,特征重要性分析和SHAP是其中最常用的技术。本综述强调,需要多学科方法将金融知识与改进的解释性范式相结合,并暴露了当前XAI系统中的重要缺陷。

通用金融学人工智能

LLM Pro金融套件:金融应用的多种语言大语言模型

金融业对高级自然语言处理(NLP)能力的需求不断增长,突显了通用大型语言模型(LLM)在处理特定领域财务任务方面的局限性。为了解决这一差距,我们推出了LLM Pro Finance Suite,这是专门为金融应用设计的5个指令调谐的LLM(从8B到70B参数)。我们的方法侧重于增强通才指导调整模型,利用其在教学遵循,推理和毒性控制方面的现有优势,同时在策划的高质量金融语料库上微调,包括超过50%的英语,法语和德语金融相关数据。我们评估LLM Pro金融套件的综合财务基准套件,在面向金融的任务和金融翻译方面显示出对最先进的基线的一致改进。值得注意的是,我们的模型保持了其基础模型的强大通用域功能,确保了非专业任务的可靠性能。这种双重熟练程度,增强的财务专业知识,而不会在一般能力上妥协,使LLM Pro Finance Suite成为财务工作流程中现有LLM的理想替代品,提供改进的特定领域性能,同时保持整体多功能性。我们公开发布两个8B参数模型,以促进金融NLP应用的未来研究和开发:https://huggingface.co/collections/DragonLLM/llm-open-finance。

统计金融学人工智能计算金融学

GraphCliff:短距离的Gating,用于微妙的差异但关键的变化

定量结构-活动关系假定分子结构与生物活性之间的平稳关系。然而,定义为具有巨大效力差异的结构相似的化合物的对活动悬崖打破了这种连续性。最近针对活动悬崖的基准显示,具有扩展连接指纹的经典机器学习模型优于图形神经网络。我们的分析显示,图嵌入物未能在嵌入空间中充分分离结构相似的分子,因此很难区分结构相似但功能不同的分子。尽管有这种限制,分子图结构本质上是表达和有吸引力的,因为它们保留了分子拓扑。为了保留分子作为图形的结构表征,我们提出了一种新的模型GraphCliff,它通过闸门机制整合短期和长期信息。实验结果表明,GraphCliff持续提高非悬崖和悬崖化合物的性能。此外,层向式节点嵌入分析揭示了相对于强大的基线图模型的过度平滑和增强的判别能力。

计算工程、金融与科学人工智能

AdaRec:通过叙事分析和双通道推理与LLM的自适应建议

我们提出了AdaRec,这是一个很少见的上下文内学习框架,利用大型语言模型进行自适应个性化推荐。 AdaRec引入了叙事分析,将用户-项目交互转化为自然语言表示,以实现统一的任务处理并增强人类的可读性。以双变量推理范式为中心,AdaRec采用双通道架构,集成了水平行为对齐,发现同行驱动的模式,具有垂直因果归因,突出了用户偏好背后的决定性因素。与现有的基于LLM的方法不同,AdaRec通过语义表示消除了手动特征工程,并支持以最小的监督进行快速交叉任务适应。对真实电子商务数据集的实验表明,AdaRec在很少的设置中优于机器学习模型和基于LLM的基线,最高可达8%。在零拍摄场景中,它比专家制作的分析提高了19%,以最小的交互数据展示了长尾个性化的有效性。此外,AdaRec生成的合成数据上的轻量级微调与完全微调模型的性能相匹配,突出了其在不同任务中的效率和推广。

计算与语言人工智能计算工程、金融与科学

机器中的锚:LLM中锚定偏见的行为和归因证据

大型语言模型(LLM)越来越多地被检查为行为主体和决策系统,但目前尚不清楚观察到的认知偏差是否反映了表面模仿或更深层次的概率变化。锚定偏见,经典的人类判断偏见,提供了一个关键的测试案例。虽然先前的工作表明LLM表现出锚定,但大多数证据依赖于表面的输出,留下了内部机制和归属贡献未开发。本文通过三个贡献推进了LLM锚定的研究:(1)基于日志概率的行为分析,显示锚转移整个输出分布,并控制训练数据污染;(2)精确到Shapley-value归因超过结构化提示字段,以量化锚对模型日志概率的影响;(3)一个统一的锚定偏差灵敏度得分,将行为和归因证据整合到六个开源模型中。结果揭示了Gemma-2B,Phi-2和Llama-2-7B的强大锚定效应,其归因表明锚影响重新加权。较小的模型,如GPT-2,Falcon-RW-1B和GPT-Neo-125M显示可变性,表明比例可以调节灵敏度。然而,在迅速的设计中,归属效应各不相同,强调了将 LLM 视为人类替代品的脆弱性。研究结果表明,在LLM中锚定偏见是健壮的,可衡量的,可解释的,同时突出了应用领域的风险。更广泛地说,该框架将行为科学,LLM安全性和可解释性联系起来,为评估LLM中的其他认知偏差提供了可重复的路径。

人工智能计算与语言通用经济学金融经济学

基于深度学习的每日股票交易系统的新型损失函数

在不断发展和动荡的股票市场中做出持续盈利的财务决策一直是一项艰巨的任务。来自不同学科的专业人士已经发展了基础理论,以预测价格走势和评估证券,如着名的资本资产定价模型(CAPM)。近年来,人工智能(AI)在资产定价中的作用一直在增长。尽管深度学习模型的黑箱性质缺乏可解释性,但它们继续巩固了在金融业的地位。我们的目标是通过引入返回加权损失功能来进一步提高AI的潜力和实用性,该功能将推动最高增长,同时为ML模型提供有限数量的信息。我们仅使用可公开访问的股票数据(开放/关闭/高/低,交易量,行业信息)和由它们构建的几个技术指标,我们提出了一个高效的每日交易系统,可以检测顶级增长机会。我们的最佳型号在2019年至2024年的1340个测试日内实现了61.73%的年化Sharpe Ratio,年化Sharpe Ratio为1.18,年回报率为37.61%,2005年至2010年,年化Sharpe比率为0.97。成功的主要驱动因素,特别是独立于任何领域知识,是新颖的返回加权损失函数,分类和连续数据的集成以及ML模型架构。我们还通过几个性能指标和统计证据,展示了我们新颖的亏损功能相对于传统损失函数的优越性。

机器学习人工智能计算金融学

断言-感知测试代码与大型语言模型的总结

单元测试通常缺乏传达测试意图的简明摘要,特别是在自动生成或记录不佳的代码库中。大型语言模型(LLM)提供了一个有前途的解决方案,但它们的有效性在很大程度上取决于它们的提示方式。与通用代码总结不同,测试代码总结带来了不同的挑战,因为测试方法通过断言而不是实现功能来验证预期行为。本文提出了91个现实世界的Java测试用例与开发人员编写的摘要配对的新基准,并进行了一个受控消融研究,以研究测试代码相关组件(如正在测试的方法(MUT),断言消息和断言语义 - 如何影响LLM生成的测试摘要的性能。我们使用 n-gram 指标(BLEU、ROUGE-L、METEOR)、语义相似性(BERTScore)和基于 LLM 的评估,在七个提示配置中评估四个代码 LLM(Codex、Codestral、DeepSeek 和 Qwen-Coder)。结果表明,使用断言语义的提示在全MUT上下文(4.45 vs.45 vs.)上将摘要质量提高了平均0.10点(2.3%)。 4.35,同时需要更少的输入令牌。 Codex和Qwen-Coder实现了与人类编写的摘要的最高一致性,而DeepSeek尽管词汇重叠很高,但表现不佳。复制包可公开查阅https://doi.org/10。 5281/zenodo.17067550

软件工程人工智能计算工程、金融与科学

人工智能和海湾合作委员会劳动力适应未来的工作

海湾合作委员会(GCC)中人工智能(AI)的迅速扩张提出了一个核心问题:对计算基础设施的投资是否与同样强大的技能,激励和治理相结合? 基于社会技术系统(STS)理论,这种混合方法研究沙特阿拉伯王国(KSA),阿拉伯联合酋长国(阿联酋),卡塔尔,科威特,巴林和阿曼的劳动力准备情况。我们结合了六个国家人工智能策略(NAS)的术语频率-逆文件频率(TF-IDF)分析,47个公开披露的人工智能计划(2017年1月至2025年4月),配对案例研究,穆罕默德·本·扎耶德人工智能大学(MBZUAI)和沙特数据人工智能管理局(SDAIA)学院,以及将石油收入松弛(技术能力)与监管一致性(社会一致性)联系起来的情景矩阵。在整个语料库中,34/47计划(0.72;95%Wilson CI 0.58-0.83)表现出联合社会技术设计;国家一级指数跨越0.57-0.90(小n;区间重叠)。情景结果表明,在我们的模拟条件下,监管趋同可能比财政能力更约束结果:分散的规则可以抵消高石油收入,而统一的标准有助于在紧缩下保持进展。我们还确定了一个新兴的双轨人才系统,研究精英与快速训练的从业者,在没有桥接机制的情况下冒着劳动力市场分叉的风险。通过将STS调查扩展到石油资源丰富,国家主导的经济体,该研究完善了理论,并设定了一个研究议程,重点是纵向耦合指标,协调人种学和基于结果的业绩指标。

计算机与社会人工智能通用经济学金融经济学

投资者决策支持金融新闻的个性化思维链总结

金融顾问和投资者与金融新闻的信息过载作斗争,其中不相关的内容和噪音掩盖了关键市场信号,阻碍了及时的投资决策。为了解决这个问题,我们提出了一个新的思维链(CoT)总结框架,将金融新闻浓缩成简洁的,事件驱动的摘要。该框架集成了用户指定的关键字,以生成个性化的输出,确保只突出显示最相关的上下文。这些个性化摘要提供了一个中间层,支持语言模型产生以投资者为中心的叙述,弥合原始新闻和可操作见解之间的差距。

通用金融学人工智能计算工程、金融与科学

Diffolio:多变量概率金融时间系列预测和投资组合构建的扩散模型

概率预测对于构建用于复杂截面依赖的高效投资组合的多元金融时间序列至关重要。在本文中,我们提出了Diffolio,一种用于多变量财务时间序列预测和投资组合构建的扩散模型。 Diffolio采用具有分层注意力架构的去噪网络,包括资产级和市场层面。此外,为了更好地反映横断面相关性,我们引入了一个相关性引导的正则器,该正则由目标相关性矩阵的稳定估计来表示。这种结构不仅从历史回报中有效提取了突出的特征,而且还从资产特异性和系统协变中提取了显着的特征,显着提高了预测和投资组合的性能。 12个行业投资组合的每日超额回报的实验结果表明,Diffolio在多变量预测准确性和投资组合表现方面优于各种概率预测基线。此外,在投资组合实验中,由Diffolio预测构建的投资组合表现出一贯强劲的表现,从而通过实现平均方差切度投资组合的夏普比率和增长最优投资组合的更高确定性等价物,从基准中跑赢表现优于基准。这些结果证明了我们提议的Diffolio不仅在统计准确性和经济意义上的优势。

计算工程、金融与科学人工智能计量经济学投资组合管理

概率价格预测技术的演变:对前方、日内和平衡市场的回顾

电价预测已成为能源市场决策的关键工具,特别是随着可再生能源渗透率的增加带来更大的波动性和不确定性。从历史上看,该领域的研究一直以点预测方法为主,该方法提供单值预测,但未能量化不确定性。然而,随着电力市场的发展,由于可再生能源集成,智能电网和监管变化,对概率预测的需求变得更加明显,为风险评估和市场参与提供了更全面的方法。本文介绍了概率预测方法的回顾,通过分位数回归技术,从贝叶斯和基于分布的方法,追踪到构象预测的最新发展。特别强调概率预测的进步,包括以有效性为重点的方法,解决不确定性估计的关键限制。此外,该审查超越了“未来日”市场,包括日内和平衡市场,其中预测挑战因更高的时间粒度和实时操作限制而加剧。我们研究最先进的方法,关键评估指标和持续挑战,如预测有效性,模型选择和缺乏标准化基准,为研究人员和从业者提供全面和及时的资源,以驾驭现代电力市场的复杂性。

统计金融学人工智能应用统计学

AgenticSciML:用于科学机器学习中新兴发现的协作多代理系统

科学机器学习(SciML)将数据驱动的推理与物理建模相结合,以解决科学和工程中的复杂问题。然而,SciML架构,损失配方和培训策略的设计仍然是一个专家驱动的研究过程,需要广泛的实验和特定问题的见解。在这里,我们介绍了AgenticSciML,这是一个协作的多代理系统,其中超过10个专门的AI代理通过结构化推理和迭代进化来合作提出,批评和完善SciML解决方案。该框架集成了结构化辩论、检索增强方法内存和集成引导的进化搜索,使代理能够生成和评估有关架构和优化程序的新假设。在整个物理知情学习和操作员学习任务中,该框架发现了超过单智能体和人类设计的基线的解决方案方法,减少了多达四个数量级。代理产生新颖的策略 - 包括自适应专家架构的混合物,基于分解的PINN和物理知情的操作员学习模型 - 这些策略在策划的知识库中没有显式地出现。这些结果表明,人工智能代理之间的协作推理可以产生紧急的方法论创新,为科学计算中的可扩展,透明和自主发现指明了一条道路。

人工智能计算工程、金融与科学机器学习

继续滚动加载更多