AI基础研究具身智能 AI金融

本网站上的内容仅供参考，不提供医疗或其他专业建议，不代表活水快报、贡献者或合作伙伴的观点。

© 2024-2025 活水快报 - 42Digest.

|

京ICP备2024044642号-15

通用经济学研究快报

相关分类

经济学

Economics

计量经济学

Econometrics

通用经济学

General Economics

理论经济学

Theoretical Economics

经济学

Economics

计量经济学

Econometrics

通用经济学

General Economics

理论经济学

Theoretical Economics

最新研究

大型语言模型在再保险中的审慎可靠性:治理、保证和资本效率

本文为评估再保险中大型语言模型(LLM)的可靠性制定了审慎框架。五支柱架构 - 治理,数据谱系,保证,弹性和监管调整 - 将来自偿付能力II,SR 11-7的监督期望以及EIOPA(2025),NAIC(2023)和IAID(2024)的指导转化为可测量的生命周期控制。该框架通过再保险AI可靠性和保证基准(RAIRAB)实施,该基准评估治理嵌入式LLM是否符合接地,透明度和问责制的审慎标准。在六个任务家族中,检索接地配置实现了更高的接地精度(0.90),减少了大约40%的幻觉和解释漂移,透明度几乎翻了一番。这些机制降低了风险转移和资本配置中的信息摩擦,表明现有的审慎理论在治理明确、数据可追溯和保证可验证时已经适应了可靠的人工智能。

人工智能机器学习通用经济学金融经济学

杀死龙:在分散的自治组织中寻求民主(DAO)

本章探讨了分散自治组织(DAO),一种基于区块链技术的新型机构形式,如何挑战传统的集中式治理结构。 DAO管理从金融到科学和数字社区的项目。它们旨在通过可编程、透明和参与式机制重新分配决策权。本章既概述了DAO所带来的机会,如激励调整,快速协调和审查抵制,以及他们面临的挑战,包括代币集中,参与度低和事实上集中化的风险。它进一步讨论了DAO和人工智能的新兴交叉点,强调了自动化增加的潜力以及人类监督和算法不透明性减少的危险。最终,我们讨论在什么情况下DAO可以履行其民主承诺或冒险复制他们寻求克服的权力不对称。

计算机与社会密码学与安全通用经济学金融经济学

全球贸易数据中废塑料错误分类的模式识别

我们提出了一个可解释的机器学习框架,以帮助识别与传统方法一起检测具有挑战性的交易数据差异。我们的系统分析贸易数据,以找到一种新的逆价量签名,这种模式报告的数量随着平均单价的减少而增加。该模型实现了0.9375的准确率,并通过将大规模的联合国数据与详细的公司级数据进行比较进行了验证,确认风险特征是一致的。这种可扩展的工具为海关当局提供了一种透明、数据驱动的方法,从常规的检查协议转向基于优先级的检查协议,将复杂的数据转化为可操作的情报,以支持国际环境政策。

通用经济学机器学习金融经济学

Modelos Empiricos de Pos-Dupla Selecao por LASSO:讨论者 para Estudos do Transporte Aereo

本文介绍并讨论了使用LASSO方法的正则化回归和模型选择的估计形式 - 最小绝对收缩和选择运算符。 LASSO被认为是应用于高维计量经济学的主要监督学习方法之一,允许使用大量数据和多个相关控件。解决了现代计量经济学中高维度性的后果和作为规范化程序基础的稀疏原则的概念问题。该研究研究了主要的双后选择和后正则化模型,包括应用于工具变量模型的变化。还简要介绍了Lassopack例程包,其语法以及HD,HDS(High-Dimension Sparse)和IV-HDS模型的例子,其中涉及固定效果估算器的组合。最后,讨论了该方法在以空运为重点的研究中的潜在应用,重点是关于航空公司和飞机燃料消耗的运行效率的实证研究。

统计方法论机器学习系统与控制通用经济学

个性化推荐的价值:来自Netflix的证据

个性化推荐系统塑造了许多在线用户选择,但其针对性使得区分推荐的价值和基础商品具有挑战性。我们构建了一个离散的选择模型,嵌入了推荐诱导的实用程序、低等级的异质性和灵活的状态依赖性,并将模型应用于 Netflix 的收视率数据。我们利用推荐算法引入的特殊变异来识别和单独评估这些组件,并恢复我们可以用来验证结构模型的无模型分流比率。我们使用该模型来评估反事实,量化个性化推荐产生的增量参与度。首先,我们表明,用矩阵分解或基于人气的算法取代当前的推荐系统,将分别减少4%和12%的参与度,并减少消费多样性。其次,建议增加的大部分消费来自有效定位,而不是机械曝光,其中极受欢迎的商品(而不是广泛吸引力或非常小众的商品)的收益最大。

通用经济学信息检索机器学习金融经济学

从双重负担到三重负担:拉丁美洲数据注释Gig经济中的性别分层

本文研究了拉丁美洲数据注释零工经济中的性别分层,特别关注女性承担的“三重负担”:无薪护理责任,经济困境以及平台介导的劳动力的波动性。数据注释曾经被称赞为全球零工经济中民主化的力量,已经演变成一个以低工资、有限的保护以及获得高技能注释任务的不平等为特征的细分劳动力市场。这项研究借鉴了对30个拉丁美洲数据注释者的探索性调查,辅以定性账户和比较次要文献,将女性注释者置于更广泛的劳动经济学辩论中,包括分割理论,平台劳动力中的垄断力量和劳动力后备军。调查结果显示,由于委内瑞拉、哥伦比亚和秘鲁等国的照顾义务和政治经济不稳定,妇女被不成比例地吸引到注释中。受访者强调低工资,不规范地获得任务和缺乏福利是核心挑战,同时也对他们的工作是否相对于男性同行的价值表示矛盾。通过将注释作为性别生存策略和全球人工智能供应链中的关键投入,本文主张将注释识别为熟练劳动力,并用于解决平台问责制,工资抑制和区域不平等的监管干预措施。

计算机与社会通用经济学金融经济学

设计错位:机器学习中的激励失败

许多高风险设置的错误成本是不对称的:在缺席时误诊肺炎是一种不便,但当存在时未能检测到它可能会危及生命。因此,用于协助此类决策的人工智能(AI)模型经常接受非对称损失功能的培训,该功能包括人类决策者在误报和假否定之间的权衡。在两个焦应用中,我们表明这种标准的对齐做法可能会适得其反。在这两种情况下,最好训练机器学习模型,其损失函数忽略了人类的目标,然后根据该目标调整预测。我们使用激励设计的经济模型与内生信息获取来合理化这一结果。我们理论框架的关键见解是,机器分类器执行的两个激励任务不是一项,而是两个激励任务:选择如何分类和学习如何分类。我们表明,虽然工程师使用正确的调整激励选择,他们可以同时减少学习的激励。我们对问题的正式处理表明,接受其直观吸引力的方法实际上会以可预测的方式错位人类和机器目标。

通用经济学机器学习金融经济学

逃离算法贷款中的次贷陷阱

即使算法贷款被广泛采用,对少数群体申请人的贷款差异仍然存在。我们研究风险管理限制的作用,特别是风险价值()和预期短缺(ES),在诱导贷款审批决策中的不平等,甚至在同等信誉的申请人中也是如此。实证研究发现,即使来自不同群体的贷款申请人同样具有信誉,对少数群体收取的利率差异也会很大。我们对根据《住房抵押贷款披露法》记录的431,551份贷款申请进行了原始分析,说明数据质量的差异与更高的贷款拒绝率和黑人借款人的利率差有关。我们开发了一个正式模型,其中主流银行(低息)比次级银行(高息)对方差风险更敏感。如果主流银行对少数群体的差异有夸大的先前信念,它可能会无限期地否认该群体信贷,因此永远不会了解向该群体提供贷款的真正风险,而次级贷款机构则以更高的利率为这一人群提供服务。我们称之为“次贷陷阱”:一种平衡,其中少数贷款人只能从高成本贷款人那里借款,即使他们像大多数申请人一样具有信誉。最后,我们表明,有限的补贴可以帮助少数群体摆脱陷阱:补贴足以涵盖主流银行的下行风险,以便它有能力向少数群体提供贷款,从而了解向少数群体提供贷款的真正风险。一旦主流银行观察到足够的贷款,其信念就会与真正的潜在风险趋同,它批准少数群体的申请,竞争会降低次级贷款的利率。

计算机与社会通用经济学金融经济学

算法建议作为竞争市场的战略信号

随着算法越来越多地介导竞争决策,其影响力超越了个人成果,扩展到塑造战略市场动态。在两项预先注册的实验中,我们研究了算法建议如何影响经典经济游戏中人类行为,具有独特的,非串通和分析可追溯的均衡。在实验1(N = 107)中,参与者通过个性化或集体算法建议进行了伯特兰价格竞争。最初,串通向上偏到的建议提高了价格,特别是在个性化时,但价格在实验过程中逐渐趋同到平衡。然而,在整个实验过程中,参与者避免将价格置于算法的建议之上,这表明建议是可接受的价格的软上限。在实验2(N = 129)中,参与者与均衡对齐或战略上偏颇的算法建议进行了Cournot数量竞争。在这里,个性化的均衡建议支持稳定的收敛,而串通向下偏移的建议导致持续的生产不足和超竞争的利润 - 默契勾结的标志。在这两个实验中,参与者对个性化建议的反应比集体建议更强烈,更一致,这可能是由于对前者的更大感知所有权。这些发现表明,算法建议可以作为战略信号,即使没有明确的沟通,也会形成协调。这些结果呼应了现实世界对算法串通的担忧,并强调了在竞争环境中对算法决策支持系统进行仔细设计和监督的必要性。

人机交互人工智能计算机与社会计算机科学与博弈论

机器中的锚:LLM中锚定偏见的行为和归因证据

大型语言模型(LLM)越来越多地被检查为行为主体和决策系统,但目前尚不清楚观察到的认知偏差是否反映了表面模仿或更深层次的概率变化。锚定偏见,经典的人类判断偏见,提供了一个关键的测试案例。虽然先前的工作表明LLM表现出锚定,但大多数证据依赖于表面的输出,留下了内部机制和归属贡献未开发。本文通过三个贡献推进了LLM锚定的研究:(1)基于日志概率的行为分析,显示锚转移整个输出分布,并控制训练数据污染;(2)精确到Shapley-value归因超过结构化提示字段,以量化锚对模型日志概率的影响;(3)一个统一的锚定偏差灵敏度得分,将行为和归因证据整合到六个开源模型中。结果揭示了Gemma-2B,Phi-2和Llama-2-7B的强大锚定效应,其归因表明锚影响重新加权。较小的模型,如GPT-2,Falcon-RW-1B和GPT-Neo-125M显示可变性,表明比例可以调节灵敏度。然而,在迅速的设计中,归属效应各不相同,强调了将 LLM 视为人类替代品的脆弱性。研究结果表明,在LLM中锚定偏见是健壮的,可衡量的,可解释的,同时突出了应用领域的风险。更广泛地说,该框架将行为科学,LLM安全性和可解释性联系起来,为评估LLM中的其他认知偏差提供了可重复的路径。

人工智能计算与语言通用经济学金融经济学

使用基于相似性的机器学习方法的年度时间序列数据集的每日预测:能源市场的案例研究

各国的政策环境变化迅速,影响能源安全指数等宏观指标。然而,该指数仅每年报告一次,限制了其对短期波动的反应。为了解决这一差距,本研究引入了每日能源安全指数的代理,并将其应用于预测每日频率的能源安全。该研究采用两个阶段的方法,通过应用六个时间序列相似性测量来识别年度能源安全指数的合适每日代理。其次,所选代理使用XGBoost算法建模,以生成15天提前预测,实现对能源安全动态的高频监控。由于代理选择,Volume Brent在大多数方法中始终成为最合适的代理。该模型表现出强劲的性能,训练集上的R平方为0.981,测试集为0.945,以及可接受的错误指标。布伦特交易量的15天预测表明短期波动,第4天左右的峰值,第8天下降,第10天附近下降,第15天下降趋势,伴随着预测间隔。通过将时间序列相似性测量与基于机器学习的预测相结合,这项研究为将低频宏观经济指标转换为高频,可操作的信号提供了一个新的框架。该方法可实现对能源安全指数的实时监控,为政策制定者和分析师提供可扩展且实用的工具,以更快地应对快速变化的政策和市场条件,特别是在数据稀缺环境中。

机器学习通用经济学金融经济学

人工智能和海湾合作委员会劳动力适应未来的工作

海湾合作委员会(GCC)中人工智能(AI)的迅速扩张提出了一个核心问题:对计算基础设施的投资是否与同样强大的技能,激励和治理相结合? 基于社会技术系统(STS)理论,这种混合方法研究沙特阿拉伯王国(KSA),阿拉伯联合酋长国(阿联酋),卡塔尔,科威特,巴林和阿曼的劳动力准备情况。我们结合了六个国家人工智能策略(NAS)的术语频率-逆文件频率(TF-IDF)分析,47个公开披露的人工智能计划(2017年1月至2025年4月),配对案例研究,穆罕默德·本·扎耶德人工智能大学(MBZUAI)和沙特数据人工智能管理局(SDAIA)学院,以及将石油收入松弛(技术能力)与监管一致性(社会一致性)联系起来的情景矩阵。在整个语料库中,34/47计划(0.72;95%Wilson CI 0.58-0.83)表现出联合社会技术设计;国家一级指数跨越0.57-0.90(小n;区间重叠)。情景结果表明,在我们的模拟条件下,监管趋同可能比财政能力更约束结果:分散的规则可以抵消高石油收入,而统一的标准有助于在紧缩下保持进展。我们还确定了一个新兴的双轨人才系统,研究精英与快速训练的从业者,在没有桥接机制的情况下冒着劳动力市场分叉的风险。通过将STS调查扩展到石油资源丰富,国家主导的经济体,该研究完善了理论,并设定了一个研究议程,重点是纵向耦合指标,协调人种学和基于结果的业绩指标。

计算机与社会人工智能通用经济学金融经济学

创始人如何塑造生成式人工智能对数字风险投资的影响

生成式人工智能(GenAI)的快速传播大大降低了启动和开发数字企业的成本。 GenAI可以通过降低资源需求和提高现有企业的业绩来实现以前不可行的创业理念。我们探索创始人的技术和管理专业知识如何塑造GenAI在这些维度上对数字企业的影响。利用跨风险类别的GenAI使用外部变化及其软件任务的广泛可用性的时间(例如,GitHub Copilot的公开发布和随后的GenAI工具),我们发现新企业发布的数量增加,在GenAI使用率相对较高的类别中,启动的中位时间显着减少。对于没有管理经验或教育的创始人来说,GenAI对新发布的影响更大,而对于具有技术经验或教育的创始人来说,其对风险投资(VC)融资可能性的影响更强。总体而言,我们的研究结果表明,GenAI扩大了缺乏管理专业知识的创始人获得数字创业的机会,并提高技术创始人之间的风险表现。

通用经济学计算机与社会金融经济学

自2010年以来,美国的地方技术获取、收入差异和求职

在现代美国劳动力市场,数字基础设施强烈影响个人如何定位机会,建立技能和提高工资。计算接入、宽带覆盖和数字素养方面的区域差异对公平和可持续性具有重要的劳动力影响。这项研究借鉴了NLSY97(全国青年纵向调查)队列的纵向数据,研究了基于地点的技术因素,个人人口统计,家庭特征和教育如何塑造收入水平和决定寻求新就业。回归分析表明,教育程度,婚姻状况和互联网使用频率强烈预测了工资和个人求职强度。区域收入差距突出表明,需要采取更本地化的干预措施,以确保公平获得技术。这项研究提出了数字基础设施如何加强或挑战服务不足社区的系统性不平等的关键问题。

计算机与社会通用经济学金融经济学

使用多代理揭示偏好的数据驱动机制设计

我们研究了一系列独立的单枪不合作游戏,其中代理玩由可调机制确定的均衡。我们只观察平衡决策,没有实用程序的参数或分配知识,我们的目标是引导均衡走向社会最优性,并证明由于游戏的结构而不可能。我们为该机制设计目标开发了一个自适应RL框架。首先,我们对帕累托最优性进行了多代理揭示偏好测试,为公用事业的存在提供了必要和充分的条件,在这些实用程序下,经验观察的混合策略纳什均衡是社会最优的。条件形成一个可处理的线性程序。使用此功能,我们构建了一个 IRL 步骤,该步骤可以计算帕累托间隙、观察到的策略与帕累托最优度的距离,并将其与策略梯度更新相结合。我们证明了全球将帕累托差距最小化的机制的趋同。这产生了一个原则性的可成就性测试:如果给定的游戏可以实现社会最优性并观察到平衡,则算法1达到它;否则,该算法证明无法实现,同时与最接近社会最优性的机制融合。我们还展示了我们的损失和强大的揭示偏好指标之间的紧密联系,允许通过既定的微观经济概念来解释算法的次优性。最后,当只有有限数量的混合策略(部分策略规范)的i.d.样本可用时,我们得出收敛的浓度边界,并设计一个分布稳健的RL过程,以实现完全指定策略的机制设计目标。

计算机科学与博弈论通用经济学金融经济学

政策提示:用合成LLM Personas预测宏观经济情景

我们评估基于角色的提示是否提高了大型语言模型(LLM)在宏观经济预测任务上的表现。使用PersonaHub语料库中的2368个经济学相关角色,我们提示GPT-4o在50个季度(2013-2025)中复制ECB专业预测者调查。我们比较了针对人类专家小组的人为预测,跨越四个目标变量(HICP,核心HICP,GDP增长,失业)和四个预测视野。我们还将结果与100个没有角色描述的基线预测进行比较,以隔离其效果。我们报告两个主要发现。首先,GPT-4o和人类预报员的准确率水平非常相似,差异在统计学上显著但实际不大。我们对2024-2025年数据的抽样评估表明,GPT-4o可以在看不见的事件中保持有竞争力的预测性能,尽管与样本内时期相比存在显着差异。其次,我们的消融实验没有从角色描述中显示出可测量的预测优势,这表明可以省略这些提示组件,以在不牺牲准确性的情况下降低计算成本。我们的研究结果提供了证据,证明GPT-4o即使在样本外的宏观经济事件中也能实现有竞争力的预测准确性,如果提供相关的上下文数据,同时揭示与人类面板相比,不同的提示会产生非常均匀的预测。

计算与语言计算工程、金融与科学通用经济学金融经济学

当保证破坏智能:人工智能劳动力市场数据治理的效率成本

像大语言模型(LLM)这样的生成式人工智能(GenAI)越来越多地集成到数字平台中,以增强信息访问,提供个性化体验并提高匹配效率。然而,这些算法的进步在很大程度上依赖于大规模的用户数据,在信息保证(保护、完整性和负责任地使用隐私数据和人工智能)与模型的学习能力和预测准确性之间造成了根本的紧张关系。我们在LinkedIn的背景下研究这种保证 - 情报权衡,利用监管干预,暂停使用用户数据进行香港模型培训。使用Revelo实验室的大规模就业和招聘启事数据以及差异设计,我们表明限制数据使用显着降低了GenAI效率,导致匹配率降低,员工更替率更高,劳动力市场摩擦加剧。对于严重依赖人工智能进行人才收购的小型快速增长的公司来说,这些影响尤其明显。我们的研究结果揭示了善意数据治理的意外效率成本,并强调信息保证虽然对信任至关重要,但在与人工智能系统设计错位时可能会破坏智能驱动的效率。这项研究有助于对人工智能治理和数字平台的新兴研究,将数据保证理论化为在数据密集型环境中的GenAI功效的体制补充和潜在约束。

计算机与社会通用经济学金融经济学

通过深度强化学习进行天然气储存建模

我们引入了GasRL,这是一个模拟器,将天然气市场的校准表示与经过深度强化学习(RL)训练的存储运营商策略模型相结合。我们用它来分析最佳库存管理如何影响均衡价格以及需求和供应的动态。我们测试了各种RL算法,发现Soft Actor Critic(SAC)在GasRL环境中表现出卓越的性能:存储运营商的多个目标 - 包括盈利能力,稳健的市场清算和价格稳定 - 都成功实现了。此外,由SAC衍生的最佳政策引起的均衡价格动态具有与现实世界价格密切相关的特征,如波动性和季节性。值得注意的是,这种对价格历史分布的坚持是在没有明确校准模型到价格数据的情况下获得的。我们展示了模拟器如何用于评估欧盟规定的最低存储阈值的影响。我们发现,这种阈值对市场抵御供应冲击分配意外变化具有积极影响。例如,在异常大的冲击下,如果阈值到位,市场中断会更经常地避免。

机器学习人工智能计算工程、金融与科学系统与控制

航空中的低成本航空公司:意义和发展

本文旨在讨论低成本航空公司对航空运输市场的影响,特别是介绍该领域专业文献的最新发现。为此,从2015年起就该主题发表的几篇论文进行了选择和分析。根据这一分析,研究涉及的主要主题分为五组:(一) 低成本航空公司对竞争航空公司的影响;(二) 对机场的影响;(三) 对航空运输需求的一般影响;(四) 对乘客选择过程的影响;(五) 对地理区域的更广泛影响。

物理学与社会系统与控制通用经济学金融经济学

适用于每周零售销售的多地平线概率预测的时态融合变压器

准确的多视距零售预测对库存和促销至关重要。我们介绍了沃尔玛每周销售(45家商店,2010-2012年)使用时间融合变压器(TFT)的新研究,该模型将静态商店标识符与时间变化的外源信号(假日,CPI,燃料价格,温度)融合在一起。该管道通过Quantile Loss产生提前1-5周的概率预测,通过变量选择网络,静态富集和时间关注产生校准90%的预测间隔和可解释性。在2012年固定保留数据集上,TFT每店周的RMSE为57.9k美元,R^2为0.9875。在5倍的时间交叉验证中,平均值为RMSE = $64.6k USD和R^2 = 0.9844,优于XGB,CNN,LSTM和CNN-LSTM基线模型。这些结果证明了库存规划和假日期优化的实用价值,同时保持模型透明度。

机器学习人工智能通用经济学金融经济学

继续滚动加载更多