
检索增强型一代(RAG)在相关证据稀疏和交叉引用的情况下,在长期,结构化的财务文件中挣扎。 本文对先进的元数据驱动的检索增强生成(RAG)技术进行了系统研究,提出并评估了利用LLM生成的元数据的新型多级RAG架构。 我们引入了一个复杂的索引管道,以创建上下文丰富的文档块,并对一系列增强进行基准测试,包括检索前过滤,检索后重新排名和丰富的嵌入,在FinanceBench数据集上对标。 我们的结果表明,虽然强大的重新排序对于精度至关重要,但最重要的性能提升来自直接用文本(上下文块)嵌入块元数据。 我们提出的最优架构将 LLM 驱动的检索前优化与这些上下文嵌入相结合,以实现卓越的性能。 此外,我们提供了一个定制的元数据再等级,为商业解决方案提供了一个引人注目的,具有成本效益的替代品,突出了峰值性能和运营效率之间的实际权衡。 这项研究为构建用于财务文档分析的健壮、元数据感知的RAG系统提供了蓝图。

准确的多视距零售预测对库存和促销至关重要。 我们介绍了沃尔玛每周销售(45家商店,2010-2012年)使用时间融合变压器(TFT)的新研究,该模型将静态商店标识符与时间变化的外源信号(假日,CPI,燃料价格,温度)融合在一起。 该管道通过Quantile Loss产生提前1-5周的概率预测,通过变量选择网络,静态富集和时间关注产生校准90%的预测间隔和可解释性。 在2012年固定保留数据集上,TFT每店周的RMSE为57.9k美元,R^2为0.9875。 在5倍的时间交叉验证中,平均值为RMSE = $64.6k USD和R^2 = 0.9844,优于XGB,CNN,LSTM和CNN-LSTM基线模型。 这些结果证明了库存规划和假日期优化的实用价值,同时保持模型透明度。

金融欺诈检测对于保持金融系统的完整性至关重要,特别是在加密货币网络等分散环境中。 尽管图形卷积网络(GCN)被广泛用于金融欺诈检测,但图形变形金刚模型(如Graph-BERT)因其基于Transformer的架构而日益突出,这减轻了过度平滑等问题。 Graph-BERT 专为静态图形设计,主要在具有无定向边缘的引用网络上进行评估。 然而,金融交易网络本质上是动态的,不断变化的结构和定向边缘代表资金流动。 为了应对这些挑战,我们引入了DynBERG,这是一种新颖的架构,将Graph-BERT与Gated Recurrent Unit(GRU)层集成在一起,以捕获多个时间步骤的时间演变。 此外,我们修改底层算法以支持定向边缘,使DynBERG非常适合动态金融交易分析。 我们在Elliptic数据集上评估我们的模型,其中包括比特币交易,包括大型加密货币市场事件期间的所有交易,黑暗市场关闭。 通过评估DynBERG在此次活动之前和之后的弹性,我们分析了其适应影响交易行为的重大市场变化的能力。 我们的模型以最先进的动态图形分类方法(如EvolveGCN和GCN)为基准测试,表现出卓越的性能,在市场关闭之前优于EvolveGCN,并在活动结束后超越GCN。 此外,一项消融研究强调了纳入时间序列深度学习组件的关键作用,展示了GRU在模拟金融交易的时间动态方面的有效性。

由Transformer架构启用的Foundation Models(FM)快速提升推动了当前的AI生态系统。 以大规模培训和下游适应性为特征的FM(作为GPT家族)取得了大规模的公众采用,推动了平台经济学和激烈投资形成的动荡市场。 由于数据的限制,评估这个快速发展的行业的脆弱性至关重要,但具有挑战性。 本文提出了合成AI漏洞指数(AIVI),重点关注FM生产的上游价值链,优先考虑公开数据。 我们将FM输出建模为五个输入的函数:计算,数据,人才,资本和能源,假设任何输入中的供应脆弱性都威胁到行业。 主要漏洞包括计算集中、数据稀缺和法律风险、人才瓶颈、资本强度和战略依赖性,以及能源需求不断升级。 承认输入的可缺陷性,我们提出了聚合子索引的加权几何平均值,使用理论或经验基准进行规范化。 尽管存在局限性和改进空间,但该初步指数旨在量化人工智能核心生产引擎中的系统性风险,并隐式揭示下游价值链的风险。

金融科技等金融特定语言模型的最新进展使公众情绪量化为基于指数的措施,但将不同的语言信号压缩到单一指标中忽略了上下文的细微差别并限制了可解释性。 为了解决这一限制,可解释的人工智能技术,特别是SHAP(Sapley Additive Explanations)被用来识别有影响力的功能。 然而,SHAP的计算成本随着输入特性呈指数级增长,使得大规模基于文本的财务数据变得不切实际。 这项研究引入了一个基于GRU的预测框架,该框架增强了GroupSHAP,该框架量化了语义相关关键字组的贡献,而不是单个令牌,大大减少了计算负担,同时保持了可解释性。 我们使用FinBERT从2015年到2024年嵌入新闻文章,将它们分组到连贯的语义组中,并应用GroupSHAP来衡量每个组对股价变动的贡献。 生成的跨多个主题的组级SHAP变量被用作预测模型的输入特征。 整个2024年S P 500指数预测的实证结果表明,与没有GroupSHAP机制的基准模型相比,我们的方法实现了MAE减少32.2%和RMSE减少40.5%。 这项研究首次展示了GroupSHAP在新闻驱动的财务预测中的应用,表明分组情绪表示同时增强了可解释性和预测性能。
继续滚动加载更多