因果网络提供了一个直观的框架来理解时间序列系统中的影响结构。 然而,周期的存在会模糊动态关系,阻碍分层分析。 这些网络通常通过多变量预测建模进行识别,但执行循环约束显着增加了计算和分析复杂性。 尽管最近取得了进展,但仍然缺乏简单、灵活的方法,很容易根据具体问题实例进行调整。 我们提出了一种拟合鰰次射向自回归过程的进化方法,并引入了一种新的分层表示,直接模拟时间序列系统中的结构元素。 在模拟数据集上,我们的模型保留了无约束模型的大部分预测准确性,并优于基于排列的替代品。 当应用于100个加密货币返回系列的数据集时,我们的方法生成了无约束模型的关键结构属性的鰰�状因果网络。 鰰凿网络是不受约束网络的大约子图,大多数删除的链接来自低影响力节点。 鉴于特征保存的高度,我们得出结论,这种加密货币价格系统在很大程度上是分层的。 我们的发现展示了一种灵活,直观的方法来识别时间序列系统中的分层因果网络,并广泛应用于计量经济学和社交网络分析等领域。
本文调查了最近一波企业比特币(BTC)国库策略背景下加密货币与股票市场之间不断发展的联系。 我们收集了39家持有BTC的上市公司的数据集,从第一次收购到2025年4月。 使用每日对数回报,我们首先通过Pearson相关性和单因子模型回归记录显着的正相关运动,发现平均BTC beta为0.62,并隔离了12家公司,包括Strategy(前身为MicroStrategy,MSTR),表现出超过1的beta。 然后,我们将公司分为三组,反映他们对BTC,流动性和回报共同运动的风险敞口。 我们使用传输熵(TE)来捕捉信息流随着时间的推移的方向。 转移熵分析一直将BTC确定为主导信息驱动因素,在重大金融事件期间,股票对BTC进行了简短的公告驱动反馈。 我们的研究结果强调了对动态对冲比率的迫切需要,以适应不断变化的信息流。 这些发现为投资者和经理提供了在数字资产日益融入企业国债的时期风险管理和投资组合多元化的重要见解。
分析复杂网络的概率模型的研究代表了一个蓬勃发展的研究领域。 在前者中,指数随机图(ERGs)多年来越来越受到关注。 到目前为止,只有线性ERG被广泛用于深入了解现实世界复杂网络的结构组织。 然而,没有一个人能够解释经验程度分布的差异。 为此,必须考虑非线性ERG。 在显示通常的均场近似力将二星模型的度校正版本退化后,我们定义了它的一个健身诱导的变体。 这种“软化”模型能够在纯规范的框架内再现样本方差,同时保留其线性对应物的解释能力。
财务情景模拟对于风险管理和投资组合优化至关重要,但它仍然具有挑战性,特别是在金融领域的高维度和小型数据设置中。 我们提出了一个扩散因子模型,将潜在因子结构集成到生成扩散过程中,将计量经济学与现代生成式AI联系起来,以应对金融模拟中维度和数据稀缺的诅咒挑战。 通过利用资产回报中固有的低维因子结构,我们使用时间变化正交投影分解了分数函数 - 扩散模型中的关键组件,并且这种分解被纳入神经网络架构的设计中。 我们得出严格的统计保证,在O(d^5/2 n^-2/(k+5))和O(d^5/4 n^-1/2(k+5))的分数估计中建立非渐近性误差约束,主要是由内在因子维度k而不是资产数量d驱动的,超过了经典非参数统计文献中维度依赖性限制,并使该框架对拥有数千个资产的市场可行。 数字研究证实,在小数据机制下,潜在子空间恢复的卓越表现。 经验分析表明,我们的框架在构建平均变量最优投资组合和因子投资组合方面的经济意义。 这项工作提出了因子结构与扩散模型的第一个理论集成,为数据有限的高维金融模拟提供了原理方法。 我们的代码可在https://github.com/xymmmm00/diffusion_factor_model。
人工智能(AI)在金融领域的整合为量化交易开辟了新的途径,特别是通过使用大型语言模型(LLM)。 然而,有效综合来自不同数据源的见解并集成结构化和非结构化数据的挑战仍然存在。 本文介绍了TradeExpert,这是一个采用专家组合(MoE)方法的新框架,使用四种专门的LLM,每个LLM分析不同的金融数据来源,包括新闻文章,市场数据,阿尔法因素和基本数据。 这些专家LLM的见解由一般专家LLM进一步综合,以做出最终预测或决定。 通过特定的提示,TradeExpert可以分别在预测模式和股票走势预测和量化股票交易的排名模式之间切换。 除了现有的基准测试之外,我们还发布了一个大规模的财务数据集,以全面评估TradeExpert的有效性。 我们的实验结果表明TradeExpert在所有交易场景中的卓越表现。
股票价格预测是金融领域一个具有挑战性的问题,受到广泛关注。 近年来,随着深度学习和图神经网络等技术的迅速发展,更多的研究方法开始专注于探索股票之间的相互关系。 然而,现有方法主要侧重于股票的短期动态关系,并将关系信息与时间信息直接整合。 他们经常忽视股票市场中股票之间复杂的非线性动态特征和潜在的高阶相互作用关系。 因此,我们在本文中提出了一个名为LSR-IGRU的股票价格趋势预测模型,该模型基于长期短期股票关系和改进的GRU投入。 首先,我们在股票之间构建一个长期短期关系矩阵,其中首次使用二级行业信息来捕获股票的长期关系,并利用隔夜价格信息建立短期关系。 接下来,我们改进了每一步GRU模型的输入,使模型能够更有效地整合时间信息和长期短期关系信息,从而显著提高预测股票趋势变化的准确性。 最后,通过对中国和美国股市的多个数据集进行广泛的实验,我们验证了拟议的LSR-IGRU模型相对于当前最先进的基线模型的优越性。 我们还将提议的模型应用于金融公司的算法交易系统,与其他基准方法相比,实现了显着更高的累积投资组合回报。 我们的消息来源发布于https://github.com/ZP1481616577/Baselines_LSR-IGRU。
基于限价单簿(LOB)数据的价格趋势预测(PTP)是金融市场的一个基本挑战。 尽管深度学习取得了进展,但现有模型未能在不同市场条件和资产上推广。 令人惊讶的是,通过将基于MLP的简单架构适应LOB,我们证明了我们超越了SoTA的性能;因此,挑战了复杂架构的必要性。 与过去显示鲁棒性问题的工作不同,我们提出了TLOB,这是一种基于变压器的模型,它使用双重注意力机制来捕获LOB数据中的空间和时间依赖关系。 这使得它能够适应性地专注于市场微观结构,使其对长视距预测和波动的市场状况特别有效。 我们还引入了一种新的标签方法,该方法改进了以前的标记方法,消除了视界偏差。 我们使用既定的FI-2010基准,纳斯达克和比特币数据集来评估TLOB在四个视野中的有效性。 TLOB在每个数据集和视界都优于SoTA方法。 此外,我们的经验表明,随着时间的推移,股价的可预测性如何下降,F1得分为6.68,突显了市场效率的不断提高。 必须考虑与交易成本相关的可预测性,因此,我们尝试使用平均差价来定义趋势,反映主要交易成本。 由此产生的业绩恶化突显了将趋势分类转化为有利可图的交易策略的复杂性。 我们认为,我们的工作为不断变化的股价趋势预测提供了新的见解,并为金融人工智能的未来发展奠定了坚实的基础。 我们发布代码在https://github.com/LeonardoBerti00/TLOB。
本文研究了温度和降水天气衍生(WD)合同的定价。 对于多伦多和芝加哥的温度相关掐架,我们将谐波回归/ARMA模型与前向神经网络(NN)进行了基准测试,发现NN减少了样本外均方误差(MSE),并实质性地改变了12月相对于时间序列模型和行业标准的历史燃烧方法(HBA)的公允值。 对于降水,我们使用复合Poisson-Gamma框架:形状和尺度参数通过最大可能性估计(MLE)和卷积神经网络(CNN)估计,在跨越多个季节的30天降雨序列上训练。 CNN自适应地学习特定季节(α,β)映射,从而捕获静态i.i.d.适合错过的政权的异质性。 在估值时,我们假设每个制度内的天数是i.i.d.Γ(α̂,β̂),并应用均值近似值(以其均值(nλ̂)取代Poisson计数以导出闭合式串流价格。 对1981-2023年NASA POWER数据的探索性分析证实,夏季和冬季(α,β)的季节性异质性明显,表明静态全球契合度不足。 对多伦多和芝加哥电网的反向测试表明,我们的制度适应性强的 CNN 产生了有竞争力的估值,并强调了模式选择如何改变扼杀价格。 在可能的情况下,通过模拟分析性评估回报,从而对预测和估值方法进行类似的比较。
准确的中期(周至一年)小时电力负荷预测对于电厂运营的战略决策、确保供应安全和电网稳定性、规划和建筑储能系统以及能源交易至关重要。 虽然许多模型有效地预测了短期(小时到几天)的小时负荷,但中期预测解决方案仍然稀缺。 在中期负荷预测中,捕捉负载的多方面特征,包括每日,每周和年度季节性模式,以及自回归效应,天气和假日影响以及社会经济非不稳定性,提出了重大的建模挑战。 为了应对这些挑战,我们提出了一种新的预测方法,使用由可解释的P-splines构建的广义添加剂模型(GAM),该模型通过自回归后处理增强。 该模型包括平滑温度,错误趋势季节性(ETS)建模和持续预测的非静态社会经济状态,度假期间,固定日期和工作日假期的影响的细致入微的表示,以及作为投入的季节性信息。 拟议的模型使用来自24个欧洲国家的负载数据进行9年多(2015-2024年)的评估。 该分析表明,与最先进的方法相比,该模型不仅具有显着的增强预测准确性,而且还提供了对单个组件对预测负载的影响的宝贵见解,因为它具有完全可解释性。 实现类似于日常传输系统操作员(TSO)预测的性能,计算时间仅为几年每小时数据几秒钟,强调了该模型在电力系统行业实际应用的潜力。
在这项研究中,我们专注于联邦环境中的财务数据分析,其中数据分布在多个客户或位置,原始数据永远不会离开本地设备。 我们的主要关注不仅在联邦学习领域开发高效的学习框架(用于保护用户数据隐私),而且还关注设计更容易解释的模型的重要性。 此外,我们关心框架对异常值的稳健性。 为了实现这些目标,我们提出了一个强大的基于联邦逻辑回归的框架,努力在这些目标之间取得平衡。 为了验证我们拟议框架的可行性,我们不仅仔细评估其性能,而且还在非IID数据上,特别是在涉及异常值的场景中。 从多个公共数据集中收集的大量数值结果表明,我们提出的方法可以在二进制和多类分类任务中实现与经典集中算法(如Logistical Regression,Decation Tree和K-Nearest Neighbors)的可比性能。
本文探讨了使用深度残余网络对世界上最大的石油和天然气生产商之一巴西石油公司(Petrobras)的欧洲期权进行定价,并将其性能与Black-Scholes(BS)模型进行了比较。 利用通过网络抓取收集的B3(巴西证券交易所)八年的历史数据,使用自定义构建的混合损失函数进行了深度学习模型的培训,该功能结合了市场数据和分析定价。 培训和测试的数据是在2016年11月至2025年1月期间绘制的,使用了80-20次火车测试。 测试集包括最后三个月的数据:11月,12月和2025年1月。 与测试集上的Black-Scholes模型相比,深度残余网络模型在3-19 BRL(巴西真实)范围内的平均绝对误差降低了64.3%。 此外,与Black-Scholes解决方案不同,Black-Scholes解决方案在较长时间内会降低其准确性,因此深度学习模型在更长的有效期内准确执行。 这些发现突出了深度学习在金融建模中的潜力,未来的工作重点是针对不同价格范围的专门模型。
股票价格的波动受到各种因素的复杂相互作用的影响,这些因素超出了历史数据的范围。 这些因素本身受到外部力量的影响,包括股票间动态、更广泛的经济因素、各种政府政策决定、战争爆发等。 此外,所有这些因素都是动态的,并随着时间的推移而变化。 在本文中,我们首次通过提出学习机制来解决外部影响下的预测问题,这些学习机制不仅从历史趋势中学习,而且还从时间知识图中纳入外部知识。 由于没有这样的数据集或时间知识图谱可用,我们用股票市场数据研究这个问题,我们构建了全面的时间知识图谱数据集。 在我们提出的方法中,我们将外部时间知识图的关系建模为图表上霍克斯过程的事件。 通过广泛的实验,我们表明,学习的动态表示有效地根据多个持有期的回报对股票进行排名,在相关指标上优于相关基线。
自从生成式人工智能问世以来,每家公司和研究人员都急于开发自己的生成模型,无论是否商业。 鉴于这些强大的新工具的大量用户,目前没有内在可验证的方法来从头开始解释当LLM(大型语言模型)学习时会发生什么。 例如,那些基于自动语音识别系统,它们必须依靠从网络上收集的庞大和天文数字的数据来产生快速高效的结果,在这篇文章中,我们开发了一种名为MarketBackFinal 2.0的后门攻击,基于声学数据中毒,MarketBackFinal 2.0主要基于现代股票市场模型。 为了显示可能依赖LLM的基于语音的变压器可能存在的脆弱性。
随着语音激活系统和语音识别技术的日益使用,对音频数据进行后门攻击的危险显著增加。 这项研究着眼于一种特定类型的攻击,称为基于随机投资的后门攻击(MarketBack),其中对手战略性地操纵音频的风格属性来愚弄语音识别系统。 机器学习模型的安全性和完整性受到后门攻击的严重威胁,为了保持音频应用程序和系统的可靠性,在音频数据的背景下,识别此类攻击变得至关重要。 实验结果表明,当中毒小于1时,MarketBack在7个受害者模型中的平均攻击成功率接近100是可行的。
在金融市场日益动荡的环境中,准确估计风险仍然是一个重大挑战。 传统的计量经济学模型,如GARCH及其变体,是基于通常过于僵化而无法适应当前市场动态复杂性的假设。 为了克服这些限制,我们提出了一个价值风险(VaR)估计的混合框架,将GARCH波动率模型与深度强化学习相结合。 我们的方法结合了使用双深Q-Network(DDQN)模型的方向性市场预测,将任务视为不平衡的分类问题。 这种架构能够根据市场情况动态调整风险水平预测。 每日Eurostoxx 50数据的经验验证涵盖了危机和高波动期,表明VaR估计的准确性显着提高,以及违规行为数量和资本要求减少,同时尊重监管风险阈值。 该模型实时调整风险水平的能力加强了其与现代和主动风险管理的相关性。
预订行为的短期变化可能会破坏旅游和酒店业的预测,特别是在全球危机期间。 传统的指标,如平均或中位交货时间,往往忽略了重要的分布变化。 这项研究引入了一个正常化的L1(曼哈顿)距离,以评估Airbnb预订从2018年到2022年的交货时间差异,重点关注美国四个主要城市的COVID-19大流行。 我们确定了两个阶段的中断:大流行开始时的突然变化,然后是部分恢复,持续偏离2018年之前的模式。 我们的方法揭示了标准统计数据错过的旅行者规划视野的变化,突出表明需要分析整个交货时间分布,以获得更准确的需求预测和定价策略。 标准化的L1指标为旅游利益相关者提供了宝贵的见解,以应对持续的市场波动。
本手稿的范围是审查分散观察的半马尔马林加的统计数据的最新发展,这些统计数据的动机是金融市场的应用。 我们通过这个领域的旅程停下来仔细看看一些选定的主题讨论最近的文学。 此外,我们强调并解释一些经典的概率和统计概念所发挥的重要作用。 我们专注于三个主要方面:跳跃测试;粗糙的分数随机波动性;和限制顺序微观结构噪声。 我们根据极端价值理论审查跳跃测试,并补充提出新统计方法的文献。 它们基于顺序统计的渐近理论和Rényi表示。 我们旅程的第二阶段访问了最近的一项研究,显示波动性是粗糙的。 我们进一步调查这一点,并建立一个最小范围的下限,探索边界,在更普遍的框架中,潜在波动的规律性在多大程度上可以恢复。 最后,我们讨论一种具有单面微观结构噪声的随机边界模型,用于高频限价价及其概率和统计基础。
我们生活在一个多变量的世界中,有效的金融投资组合建模,包括其构建,分配,预测和风险分析,如果不明确建模其资产的依赖结构,就不可能实现。 依赖性结构可以比投资和风险模型中的许多其他参数更多地推动投资组合结果,有时甚至超过其综合效应,但文献提供的相对较少,可以在具有挑战性的现实世界的金融数据条件下以可用和有用的方式定义依赖措施的有限样本分布。 然而,这正是对他们的估计做出有效推断所需要的,并将这些推断用于无数基本目的,例如假设测试,动态监测,现实和粒度情景和反向情景分析,以及减轻市场动荡期间相关性崩溃的影响(这是我们最需要有效推断的时候)。 这项工作开发了一种新的直接方法,非参数角度相关性(NAbC),用于定义任何依赖度测量的有限样本分布,其成对关联矩阵是正定的(例如。 Pearsons,Kendalls Tau,Spearmans Rho,Chatterjees,Lancasters,Szekelys及其许多变体。 该解决方案在边际资产分布下仍然有效,其特征是序列相关性明显不同和不同程度的序列相关性,非静态性,重尾性和不对称性。 值得注意的是,NAbCs p值和置信区间在基质水平和成对细胞水平上都保持分析一致。 最后,NAbC即使在矩阵中选定的单元格被冻结用于给定情景或压力测试时也保持有效性,即受场景影响,从而实现灵活,粒度和现实的场景。
算法交易依赖于从各种金融数据源中提取有意义的信号,包括烛台图表,订单统计和取消订单,交易量数据,限制订单簿和新闻流。 虽然深度学习在处理非结构化数据方面取得了显着的成功,并且具有显着先进的自然语言处理,但其对结构化财务数据的应用仍然是一个持续的挑战。 这项研究调查了深度学习模型与金融数据模式的集成,旨在提高交易策略和投资组合优化的预测性能。 我们提出了一种新的方法,通过开发嵌入技术并将顺序限价单簿快照作为基于图像的表示中不同的输入通道,将限价单书分析纳入算法交易。 我们处理限价订单账面数据的方法在高频交易算法中实现了最先进的性能,强调了深度学习在金融应用中的有效性。
政府财政政策,特别是年度工会预算,对金融市场产生了重大影响。 然而,对预算对具体部门公平业绩的影响的实时分析在方法上仍然具有挑战性,而且基本上没有加以探索。 这项研究提出了一个框架,系统地确定和排名准备从印度联盟预算公告中受益的部门。 该框架涉及两个核心任务:(1)将预算记录摘录的多标签分类为81个预先定义的经济部门,(2)这些部门的业绩排名。 利用1947年至2025年印度联盟预算记录的综合语料库,我们引入了BASIR(预算辅助部门影响排名),这是一个注释的数据集映射从预算记录到部门影响。 我们的架构包括用于部门识别的微调嵌入,以及根据其预测性能对扇区进行排名的语言模型。 我们的结果表明,在部门分类方面有0.605 F1得分,在根据预算后的表现预测部门排名中,NDCG得分为0.997。 该方法使投资者和政策制定者能够通过结构化,数据驱动的见解量化财政政策影响,解决手动分析中的关键差距。 注释数据集已在CC-BY-NC-SA-4.0许可下发布,以推进计算经济学研究。
No more items to load.