AI如何看待经济政策? 虽然在经济学中使用大型语言模型(LLM)呈指数级增长,但他们在经济问题上的假设仍然是一个黑匣子。 本文使用连体实验来梳理影响LLM对经济政策评估的主要因素。 它发现LLM对失业,不平等,金融稳定和环境危害最敏感,对经济增长,通货膨胀和政府债务等传统宏观经济问题不那么敏感。 结果在跨场景和跨模型之间非常一致。
在本文中,我们探讨了大型语言模型(LLM)如何通过系统地比较它们与全球人类参与者的反应来处理财务决策。 我们向七种领先的LLM提出了一组常用的财务决策问题,包括GPT系列(GPT-4o,GPT-4.5,o1,o3-mini),Gemini 2.0 Flash和DeepSeek R1的五种型号。 然后,我们将它们的输出与来自涵盖53个国家的数据集的人类响应进行比较。 我们的分析揭示了三个主要结果。 首先,LLM通常表现出风险中立的决策模式,在面对彩票类型的问题时,倾向于与预期价值计算一致的选择。 其次,在评估当前和未来之间的权衡时,LLM偶尔会产生与规范推理不一致的反应。 第三,当我们研究跨国相似性时,我们发现LLM的总体反应与来自坦桑尼亚的参与者的反应最为相似。 这些发现有助于理解LLM如何模仿类人的决策行为,并突出其产出中潜在的文化和培训影响。
Graph Neural Networks (GNNs) have achieved outstanding performance across a wide range of graph-related tasks. However, their "black-box" nature poses significant challenges to their explainability, and existing methods often fail to effectively capture the intricate interaction patterns among nodes within the network. In this work, we propose a novel explainability framework, GraphEXT, which leverages cooperative game theory and the concept of social externalities. GraphEXT partitions graph nodes into coalitions, decomposing the original graph into independent subgraphs. By integrating graph structure as an externality and incorporating the Shapley value under externalities, GraphEXT quantifies node importance through their marginal contributions to GNN predictions as the nodes transition between coalitions. Unlike traditional Shapley value-based methods that primarily focus on node attributes, our GraphEXT places greater emphasis on the interactions among nodes and the impact of structural changes on GNN predictions. Experimental studies on both synthetic and real-world datasets show that GraphEXT outperforms existing baseline methods in terms of fidelity across diverse GNN architectures , significantly enhancing the explainability of GNN models.
商品交易顾问(CTA)历来依赖于趋势遵循的规则,这些规则在从长期突破截然不同的视野中运作,这些突破捕捉了在快速移动市场中蓬勃发展的短期动力信号的主要方向性移动。 尽管在趋势方面进行了大量工作,但短期长期趋势系统的相对优点和相互作用仍然存在争议。 本文通过(i)动态分解CTA回归为短期趋势,长期趋势和市场测试因素,使用贝叶斯图形模型,以及(ii)显示视野的混合如何塑造策略的风险调整性能。
在加密货币限价单簿(LOB)中检测异常值对于理解市场动态至关重要,特别是在高度波动和新兴的监管环境中。 这项研究对强大的统计方法和先进的机器学习技术进行了全面的比较分析,用于在加密货币LOB中实时异常识别。 在一个名为AITA Order Book Signal(AITA-OBS)的统一测试环境中,我们评估了13个不同模型的功效,以确定哪些方法最适合检测潜在的操纵交易行为。 通过在主要交易所的26,204条记录数据集上进行的经验评估表明,表现最佳的模型Emporical Covariance(EC)实现了6.70。
商品交易顾问(CTA)历来依赖于趋势遵循的规则,这些规则在从长期突破截然不同的视野中运作,这些突破捕捉了在快速移动市场中蓬勃发展的短期动力信号的主要方向性移动。 尽管在趋势方面进行了大量工作,但短期长期趋势系统的相对优点和相互作用仍然存在争议。 本文通过(i)动态分解CTA回归为短期趋势,长期趋势和市场测试因素,使用贝叶斯图形模型,以及(ii)显示视野的混合如何塑造策略的风险调整性能。
本文提出了使用多目标线性和非线性受限优化技术优化电子设计中电容器选择的新框架。 我们展示了这种方法在最小化成本和电路板领域的有效性,同时满足关键性能要求。
机器学习模型测试的正确设计和架构,特别是在应用于量化财务问题方面,是至关重要的。 在这个过程中,最重要的是选择用于训练、验证、估计和调优超参数的适当的损失函数。 因此,在这项研究中,通过股票和加密货币资产的经验实验,我们引入了平均绝对定向损失(MADL)功能,该功能更适合优化算法投资策略中使用的预测生成模型。 MADL函数结果比较了Transformer和LSTM模型,我们发现几乎在每种情况下,Transformer的结果都明显优于LSTM。
AI如何看待经济政策? 虽然在经济学中使用大型语言模型(LLM)呈指数级增长,但他们在经济问题上的假设仍然是一个黑匣子。 本文使用连体实验来梳理影响LLM对经济政策评估的主要因素。 它发现LLM对失业,不平等,金融稳定和环境危害最敏感,对经济增长,通货膨胀和政府债务等传统宏观经济问题不那么敏感。 结果在跨场景和跨模型之间非常一致。
在加密货币限价单簿(LOB)中检测异常值对于理解市场动态至关重要,特别是在高度波动和新兴的监管环境中。 这项研究对强大的统计方法和先进的机器学习技术进行了全面的比较分析,用于在加密货币LOB中实时异常识别。 在一个名为AITA Order Book Signal(AITA-OBS)的统一测试环境中,我们评估了13个不同模型的功效,以确定哪些方法最适合检测潜在的操纵交易行为。 通过在主要交易所的26,204条记录数据集上进行的经验评估表明,表现最佳的模型Emporical Covariance(EC)实现了6.70。
量化预测模型的不确定性对于评估和减轻与数据驱动决策相关的风险至关重要,特别是在电力市场等动荡领域。 机器学习方法可以提供高度准确的电价预测,对于告知市场参与者的决策至关重要。 然而,这些模型往往缺乏不确定性估计,这限制了决策者避免不必要风险的能力。 在本文中,我们提出了一种新的方法来从点预测集合中生成概率预测,称为同位素分位数回归平均(iQRA)。 在Quantile Regression Averaging(QRA)的既定框架的基础上,我们引入了随机顺序约束,以提高预测准确性,可靠性和计算成本。 在一项对德国电力市场的广泛预测研究中,我们表明iQRA在可靠性和清晰度方面始终优于最先进的后处理方法。 它在多个置信水平之间产生经过良好校准的预测间隔,为所有基准方法提供卓越的可靠性,特别是基于覆盖的构象预测。 此外,同位素正则化降低了分位数回归问题的复杂性,并为变量选择提供了一种无参数的方法。
代币化美国 国债已成为现实世界资产(RWA)的突出子类,提供加密强制执行的,由主权债务抵押并在多个区块链网络中部署的具有收益的工具。 虽然市场迅速扩大,但对交易水平行为的实证分析仍然有限。 本文对美国进行定量、功能层面的剖析。 财政部支持的RWA代币,包括BUIDL,BENJI和USDY,横跨多链:主要是以太坊和Layer-2。 我们分析解码的合同调用隔离核心功能原语,如发行,赎回,转移和桥梁活动,揭示了机构行为者和零售用户之间行为的细分。 为了模拟地址级别的经济角色,我们引入了使用庞加莱嵌入和基于流动性的图形特征的曲率感知表示学习框架。 我们的方法优于RWA财务库数据集上的基线模型,在角色推断中,并概括为下游任务,如更广泛的区块链交易网络中的异常检测和钱包分类。 这些发现从交易层面的角度对代币化财务中的功能异质性和参与者角色提供了结构化的理解,为研究链上金融化提供了新的经验证据。
气候变化不仅威胁到农业生产者,也威胁到相关的公共机构和金融机构。 这些重要的粮食系统行为者包括负责确保种植者生计和支持应对持续全球变暖的政府实体。 我们研究美国未来的风险。 玉米带地理区域为这样一个关键机构:美国 联邦作物保险计划。 具体而言,我们预测气候驱动的作物损失在具有政策重要性的“风险单位”规模的影响。 通过我们展示的神经网络蒙特卡洛方法构建,模拟预测了更频繁和更严重的损失,这将导致本世纪中叶玉米收益保护保险索赔的年度概率翻倍。 我们还提供了一个开源的管道和交互式可视化工具,通过可配置的统计处理来探索这些结果。 总之,我们填补了当前对气候适应的理解中的一个重要空白,通过弥合现有的历史产量估计和气候预测,以预测与政策相关的粒度的作物损失指标。
生存建模预测事件发生的时间,并广泛用于风险分析;例如,它用于医学,根据审查的数据预测患者的生存率。 需要大规模、现实和免费可用的数据集,用于对人工智能(AI)生存模型进行基准测试。 在本文中,我们从Decentralized Finance(DeFi)中借出加密货币产生的公开交易数据中得出了16个生存建模任务。 每个任务都是使用基于索引和结果事件选择的自动化管道构建的。 例如,该模型预测用户从借入加密货币(索引事件)到首次还款(结果事件)的时间。 我们制定了由16个生存时间预测任务(FinSurvival)组成的生存基准。 我们还通过使用限制的平均生存时间阈值来自动为每个任务创建16个相应的分类问题。 FinSurvival拥有超过750万条记录,提供了一套逼真的财务建模任务,将刺激未来的AI生存建模研究。 我们的评价表明,这些任务具有挑战性,现有方法没有很好地解决。 FinSurvival能够评估适用于传统金融,工业,医药和商业的AI生存模型,目前由于缺乏大型公共数据集而受到阻碍。 我们的基准展示了人工智能模型如何评估DeFi的机会和风险。 在未来,FinSurvival基准管道可用于创建新的基准,随着加密货币的使用增长,通过整合更多的DeFi交易和协议。
我们通过估计使用分配强化学习(DistRL)的全部回报分布来重新解释和提出定价依赖路径的金融衍生品的框架。 与专注于预期期权价值的传统方法不同,我们的方法模拟了回报的整个条件分布,允许风险感知定价,尾部风险估计和增强的不确定性量化。 我们使用基于分位数的价值函数近似器证明了这种方法在亚洲期权上的功效。
共享移动服务(SMS),例如,需求响应式运输或乘车共享,可以改善低密度地区的移动性,而传统公共交通(PT)通常服务不足。 这种改善通常通过基本绩效指标来衡量,例如等待或旅行时间。 然而,这些基本指标并没有说明短信可以为领土提供的最重要贡献,即增加用户获得周围机会的潜力,如工作、学校、企业等。 这种潜力可以通过基于异构体的可及性指标来衡量,该指标计算了在有限的时间内可达到的机会数量,因此公众很容易理解。 已经对短信对可获取性的潜在影响进行了定性讨论,并对公平性的影响进行了实证研究。 然而,到目前为止,还没有定量方法来计算通过短信实现的基于异色酮的指标。 这项工作填补了这一空白,提出了第一种方法来计算由传统PT和SMS组成的PT系统的异构体可访问性,作为访问和进出PT集线器的支线。 该方法基于通过Kriging进行的空间-时间统计分析。 它作为输入观察到的短信旅行,并在图表中总结它们。 在这样的图中,计算异构体可访问性指标。 我们将建议的方法应用于巴黎 - 萨克莱郊区关于需求响应运输的MATSim模拟研究。
本文对以太坊上集中式和分散式交易所(CEX-DEX)之间的套利背后的经济学和动态进行了全面的实证分析。 我们改进了保湿法,以识别从链上数据中的套利交易,并引入强大的经验框架来估计套利收入,而无需了解交易者在CEX上的实际行为。 利用从2023年8月至2025年3月的19个月广泛的数据集,我们估计从7,203,560名已确定的CEX-DEX套利中19名主要的CEX-DEX搜索者提取的总计2.338亿美元。 我们的分析揭示了越来越多的集中化趋势,因为三个搜索者捕获了体积和提取价值的四分之三。 我们还证明,搜索者的盈利能力与与块构建器的集成水平有关,并发现独家搜索者与构建者的关系及其市场影响。 最后,我们纠正了以前被低估的块构建者与搜索者垂直整合的盈利能力。 这些见解照亮了MEV景观最黑暗的角落,并突出了CEX-DEX套利对以太坊去中心化的重大影响。
在本文中,我们探讨了大型语言模型(LLM)如何通过系统地比较它们与全球人类参与者的反应来处理财务决策。 我们向七种领先的LLM提出了一组常用的财务决策问题,包括GPT系列(GPT-4o,GPT-4.5,o1,o3-mini),Gemini 2.0 Flash和DeepSeek R1的五种型号。 然后,我们将它们的输出与来自涵盖53个国家的数据集的人类响应进行比较。 我们的分析揭示了三个主要结果。 首先,LLM通常表现出风险中立的决策模式,在面对彩票类型的问题时,倾向于与预期价值计算一致的选择。 其次,在评估当前和未来之间的权衡时,LLM偶尔会产生与规范推理不一致的反应。 第三,当我们研究跨国相似性时,我们发现LLM的总体反应与来自坦桑尼亚的参与者的反应最为相似。 这些发现有助于理解LLM如何模仿类人的决策行为,并突出其产出中潜在的文化和培训影响。
在这篇文章中,我们开发了一个基于内核的框架,用于在均值最优标准下构建动态的、依赖路径的交易策略。 基于(Muca Cirone和Salvi,2025)的理论结果,我们将交易策略参数化为复制内核Hilbert空间(RKHS)中的函数,从而实现灵活和非马尔可维处理最佳投资组合问题的方法。 我们将其与基于签名的框架(Futter,Horvath,Wiese,2023)进行比较,并证明当资产动力学或预测信号表现出合成和市场数据示例的时间依赖性时,两者都显着优于经典的马尔科维方法。 在这种情况下使用内核提供了显著的建模灵活性,因为特征嵌入的选择可以从随机签名到神经网络架构的最终层。 至关重要的是,我们的框架保留了封闭式解决方案,并提供了基于梯度优化的替代方案。
我们提出了一个数学上严格的框架,用于识别和完成去中心化交换(DEX)聚合器中的必然性(CoW)循环。 与CoWSwap等现有的基于拍卖的系统不同,我们的方法引入了一种资产矩阵公式,该公式不仅使用神谕价格和正式保护法验证可行性,而且还完成了使用图形遍历发现并通过不平衡校正解决的交换订单的部分CoW循环。 我们定义桥接订单,并显示由此产生的执行是无滑点和LP的资本保存。 应用于现实世界的Arbitrum交换数据,我们的算法演示了CoW周期的有效发现,并支持插入原子循环闭合的合成订单。 这项工作可以被认为是提供做市商的流动性的潜在三角洲中性策略的细节:结构化的CoW周期执行。
本文概述了一种激励驱动和分散的方法,以大规模验证数字内容的真实性。 广泛的错误信息,人工智能生成内容的爆炸式增长以及对传统新闻来源的依赖,需要一种新的内容真实性和真相探索方法,以适应现代的数字世界。 通过使用智能合约和数字身份将“信任”纳入发布内容的奖励功能,而不仅仅是参与,我们认为,通过基于社区的治理模式,可以促进自我推动的范式转变,以打击错误信息。 本文中描述的方法要求内容创作者在事实索赔中持有财务抵押品,要求公正的陪审团审查捐款的财务奖励。 我们假设,通过正确的财务和社会激励模式,用户将积极参与众包事实检查,内容创作者将更多地关注他们的证明。 这是一篇探索性文件,有许多悬而未决的问题和问题值得进一步分析和探索。
大型语言模型(LLM)越来越多地部署在代理框架中,其中提示触发复杂的基于工具的分析以追求目标。 虽然这些框架在包括金融在内的多个领域都显示出希望,但它们通常缺乏有原则的模型构建步骤,而是依赖于基于情绪或趋势的分析。 我们通过开发一个代理系统来解决这个差距,该系统使用LLM迭代地发现财务时间序列的随机微分方程。 这些模型生成风险指标,为每日交易决策提供信息。 我们在传统的反测试和使用市场模拟器中评估我们的系统,该模拟器引入了合成但具有因果关系的价格路径和新闻事件。 我们发现,模型知情的交易策略优于标准的基于LLM的代理,提高了多个股票的夏普比率。 我们的结果表明,将LLM与代理模型发现相结合可以增强市场风险估计,并实现更有利可图的交易决策。
投资放牧,一种家庭模仿他人决定而不是依靠自己的分析的现象,对金融市场和家庭行为产生了重大影响。 过度的投资放牧可能会减少投资,导致家庭消费的枯竭,这被称为挤出效应。 虽然现有的研究已经对投资放牧对消费的影响进行了定性研究,但该领域的定量研究仍然有限。 在这项工作中,我们调查了投资放牧影响下家庭的最佳投资和消费决策。 我们制定了一个优化问题,以模拟投资放牧如何影响家庭决策。 基于最优的控制理论,我们解决最优投资和消费决策的分析解决方案。 我们从理论上分析投资放牧对家庭消费决策的影响,并证明挤出效应的存在。 我们进一步探索利率、超额收益率和波动性等参数如何影响挤出效应。 最后,我们进行真正的数据测试,以验证我们对挤出效应的理论分析。 这项研究对于理解投资放牧对家庭消费的影响至关重要,并为寻求刺激消费和减轻投资放牧对经济增长的负面影响的政策制定者提供了有价值的见解。
随着数字支付技术的进步,全球各国央行越来越多地开始探索实施央行数字货币(CBDC)。 本文全面回顾了CBDC系统设计和实施的最新发展。 通过分析2018年至2025年间发表的135篇研究论文,该研究对CBDC设计分类和生态系统框架进行了深入研究。 该论文以CBDC设计金字塔为基础,通过彻底调查分类账技术的创新,选择共识机制以及与离线支付和数字钱包集成相关的挑战,完善并扩展了关键的建筑元素。 此外,它概念化了CBDC生态系统。 对26个现有的CBDC系统进行了详细的比较分析,分为四个维度:系统架构、分类账技术、访问模型和应用领域。 调查结果显示,最常见的配置包括双层架构、分布式账本技术(DLT)和基于令牌的访问模型。 然而,在应用领域没有出现主导趋势。 值得注意的是,最近的研究表明,人们越来越关注利用CBDC进行跨境支付,以解决当前系统中的低效和结构性延误。 最后,本文为未来的研究提供了几个前瞻性的建议。
目前的工作解决了洗钱问题。 引入了一个新的过程,它通过变压器神经网络利用定性和定量数据的结构化时间序列。 这个过程的第一步是通过对比学习(没有任何标签)来学习时间序列的表示。 第二步利用这些陈述来生成所有观察结果的洗钱评分。 然后采用双阈值方法,通过Benjamini-Hochberg(BH)程序确保受控假阳性率。 实验证实,变压器能够产生通用表示,在领域专家的最低限度监督下,成功地利用洗钱模式。 它还说明了检测非欺诈者和欺诈者的新程序的能力较高,同时保持了假阳性率的控制。 这与基于规则的程序或基于LSTM架构的程序形成鲜明对比。