
尽管数据在AI生产中扮演核心角色,但它仍然是最不被理解的输入要素。随着AI实验室耗尽公共数据并转向专有数据源,交易金额达到数亿美元,计算机科学、经济学、法学和政策领域的研究变得碎片化。我们通过三个贡献将数据经济学确立为一个连贯的领域。首先,我们描述了数据的独特属性——非竞争性、上下文依赖性以及通过污染产生的涌现竞争性——并追溯了石油和谷物等商品市场形成的历史先例。其次,我们系统性地记录了2020年至2025年的AI训练数据交易,揭示了持续的市场碎片化、五种不同的定价机制(从按单位许可到委托定制),以及大多数交易将原始创作者排除在补偿之外的现象。第三,我们提出了可交换数据单元的正式层次结构(token、record、dataset、corpus、stream),并主张在生产函数中明确表示数据。基于这些基础,我们概述了数据经济学基础的四个开放研究问题:测量上下文依赖的价值、平衡治理与隐私、估计数据对生产的贡献,以及为异质组合商品设计机制。

本文旨在讨论低成本航空公司对航空运输市场的影响,特别是介绍该领域专业文献的最新发现。 为此,从2015年起就该主题发表的几篇论文进行了选择和分析。 根据这一分析,研究涉及的主要主题分为五组:(一) 低成本航空公司对竞争航空公司的影响;(二) 对机场的影响;(三) 对航空运输需求的一般影响;(四) 对乘客选择过程的影响;(五) 对地理区域的更广泛影响。

准确的多视距零售预测对库存和促销至关重要。 我们介绍了沃尔玛每周销售(45家商店,2010-2012年)使用时间融合变压器(TFT)的新研究,该模型将静态商店标识符与时间变化的外源信号(假日,CPI,燃料价格,温度)融合在一起。 该管道通过Quantile Loss产生提前1-5周的概率预测,通过变量选择网络,静态富集和时间关注产生校准90%的预测间隔和可解释性。 在2012年固定保留数据集上,TFT每店周的RMSE为57.9k美元,R^2为0.9875。 在5倍的时间交叉验证中,平均值为RMSE = $64.6k USD和R^2 = 0.9844,优于XGB,CNN,LSTM和CNN-LSTM基线模型。 这些结果证明了库存规划和假日期优化的实用价值,同时保持模型透明度。

由Transformer架构启用的Foundation Models(FM)快速提升推动了当前的AI生态系统。 以大规模培训和下游适应性为特征的FM(作为GPT家族)取得了大规模的公众采用,推动了平台经济学和激烈投资形成的动荡市场。 由于数据的限制,评估这个快速发展的行业的脆弱性至关重要,但具有挑战性。 本文提出了合成AI漏洞指数(AIVI),重点关注FM生产的上游价值链,优先考虑公开数据。 我们将FM输出建模为五个输入的函数:计算,数据,人才,资本和能源,假设任何输入中的供应脆弱性都威胁到行业。 主要漏洞包括计算集中、数据稀缺和法律风险、人才瓶颈、资本强度和战略依赖性,以及能源需求不断升级。 承认输入的可缺陷性,我们提出了聚合子索引的加权几何平均值,使用理论或经验基准进行规范化。 尽管存在局限性和改进空间,但该初步指数旨在量化人工智能核心生产引擎中的系统性风险,并隐式揭示下游价值链的风险。

这项工作分析了在罕见事件环境中定价二元期权的计算负担,并引入了对金融衍生品的自适应多级拆分(AMS)方法的改编。 标准蒙特卡洛是低效的深出的钱二进制文件,由于不连续的回报和低运动概率,需要非常大的样本来准确估计。 在Black-Scholes和Heston动力学下为二元期权开发AMS方案,将罕见事件问题重新表述为一系列条件事件。 数字实验将该方法与蒙特卡洛和其他技术(如反谐变量和多级蒙特卡洛(MLMC))进行了比较,涉及四个合同:欧洲数字呼叫和放,以及亚洲数字调用和放。 结果显示,在保持不偏不倚的同时,深度出钱的案例的计算收益高达200倍。 没有证据表明AMS先前适用于金融衍生品。 该方法提高了稀有性合同的定价效率,如参数化保险和灾难相关证券。 提供了开源的Rcpp实现,支持多种离散化和重要性函数。
继续滚动加载更多