大型语言模型(LLM)支持生成式社会模拟,能够捕捉在线社交平台上文化知情、规范引导的互动。我们构建了一个基于Voat的技术社区模拟,Voat是一个类似Reddit的另类右翼新闻聚合和讨论平台,活跃于2014年至2020年。使用YSocial框架,我们用从Voat共享URL中采样的固定技术链接目录(覆盖30多个域)来初始化模拟,并使用MADOC数据集中的样本校准参数以匹配Voat的v/technology。代理使用基础、未经审查的模型(Dolphin 3.0,基于Llama 3.1 8B)和简洁的角色(人口统计、政治倾向、兴趣、教育、毒性倾向)来生成帖子、回复和反应,遵循平台规则进行链接和文本提交、线程回复和日常活动周期。我们运行了一个30天的模拟,并通过比较分布和结构与匹配的Voat数据来评估操作有效性:活动模式、互动网络、毒性和主题覆盖。结果表明熟悉的在线规律:相似的活动节奏、重尾参与、稀疏低聚类互动网络、核心-外围结构、与Voat的主题对齐以及升高的毒性。当前研究的局限性包括无状态代理设计和基于单次30天运行的评估,这限制了外部有效性和方差估计。该模拟生成逼真的讨论,经常包含毒性语言,主要围绕技术主题,如Big Tech和AI。这种方法提供了一个有价值的手段,用于在受控环境中检查毒性动态和测试审核策略。
经济复杂性是评估现代经济体生产能力和未来增长的有力工具。然而,对于经济复杂性在历史长河中如何演变,我们知之甚少。在本文中,我们利用罗马帝国的考古证据——以耐久材料(即铭文)保存的简短文本——来估算帝国各个行省的经济复杂性。通过将铭文文本中列出的职业与铭文物品发现地点联系起来,我们可以估算出罗马帝国最初四个世纪中最复杂的地区与当今最复杂的国家之间存在显著且统计学上显著的重叠。虽然我们无法解释经济复杂性为何能够跨越时代得以保存,但这一证据表明了经济能力发展的难度。
这项工作引入了一个贝叶斯框架,统一了广泛的意见动态模型。 在这个框架中,个人对主题的看法是他们信念的预期值,表示为具有先验分布的随机变量。 在收到信号后,模拟为先验信念加上偏置术语,并带有已知分布的零均噪声,个人通过贝叶斯规则更新其信念分布。 通过系统地改变先前,偏差和噪声分布,这种方法可以恢复广泛的意见动态模型,包括DeGroot,有界置信度,有界移位以及表现出过度反应或适得其反效应的模型。 我们的分析显示,信号得分是每个模型数学结构的关键决定因素,支配着小信号和大信号行为。 所有模型都收敛到DeGroot对小信号的线性更新规则,但对大信号的尾部行为有分歧。 这种统一不仅揭示了以前脱节的模型之间的理论联系,而且还提供了一种产生新模型的系统方法,为在认知约束下形成意见的理性基础提供了见解。
高性能图形库(如GraphBLAS)的出现使大规模网络数据集得以分析,并揭示了它们行为的新模型。 复杂网络行为的物理类比对于理解这些新发现的网络现象是一种有用的帮助。 以前的工作利用了规范的Gull's Lighthouse问题,并开发了一种计算启发式,用于使用此模型对大规模网络流量进行建模。 使用这种方法的一般解决方案需要克服由此产生的微分方程中的基本数学奇点。 进一步的调查揭示了一种更简单的物理解释,减轻了解决具有挑战性的微分方程的需要。 具体来说,在时间t时在时间“距离”r(t)处观察源的概率是p(t)∝ 1/r(t)^2。 这种类比与许多物理现象一致,可以成为直觉的丰富来源。 将这种物理类比应用于匿名网络传感图形挑战数据中观察到的源相关性,导致一个优雅的网络轨道类比,可能有助于理解网络行为。
本文介绍了分布式光纤传感(DFOS)拥塞中的流量状态估计(TSE)方法。 DFOS检测车辆沿光纤的驱动振动,并在时空平面中获得其轨迹。 从这些轨迹中,DFOS为没有死区的实时空间连续交通监控提供了平均速度。 然而,当车辆振动强度因速度缓慢而不够低时,无法获得轨迹,导致平均速度数据中缺少值。 它限制了DFOS在严重拥堵中的适用性。 因此,本文提出了基于数据同化缺失值的估算方法。 我们提出的方法在日本两条高速公路上使用参考数据进行验证。 结果表明,与未缺失值的MAE相比,引用的均值平均速度(MAE)仅增加1.5公里/小时。 这项研究增强了DFOS在实际情况下的广泛适用性。
我们通过禁止人们离开来隔离一个或多个地点,从而控制流行病在网络上的传播。 为此,我们建立在易感染易感和易感染的离散时间网络模型的基础上,封装了通过从网络中移除链接来捕获移动性限制的控制动作。 然后,我们制定了基于流动性禁令的最佳制定控制政策的问题,该政策可以减轻医疗保健系统的负担以及与干预措施相关的社会和经济成本。 移动性禁止的二进制性阻碍了使用标准优化方法解决控制问题的可能性,从而产生了一个NP-hard问题。 在这里,通过制定控制问题的四足无约束二进制优化(QUBO)公式来解决,并利用量子计算不断增长的潜力来有效地解决它。
我们展示了Quantum Brush,一种利用量子计算来产生新颖的艺术表达的开源数字绘画工具。 该工具包括四种不同的笔刷,将笔画转化为独特的量子算法,每个刷子都突出了量子效应可以产生新奇美学的不同方式。 每个刷子都设计为与当前嘈杂的中间尺度量子(NISQ)设备兼容,通过在IQM的Sirius设备上执行它们来证明。
在这篇文章中,我们旨在分析网络科学中哪些数字作为节点和边缘模式的性质及其后果,称为“社区”。 将这些模式描述为多方面和矛盾的,我们建议将社区的概念描述为“模糊操作符”,这是Susan Leigh Star对边界对象概念的变体,并提议构建不同描述模式的能力在某些寄存器中既模糊又在其他寄存器中超精确,是数字政治和“社区”分析的核心。 从数学和软件研究中得出的术语与这些形成互动,可以更广泛地绘制其形成图。 然后,在网络科学中区分不同的血统,使我们能够将2002年由米歇尔·吉尔万和马克·纽曼推广的“社区”的创始账户联系起来。 在研究了一个特定的社区检测算法,即广泛使用的“ Louvain 算法”之后,我们评论了一些更模糊的应用所产生的争议。 我们认为,“社区”可以作为一种真正的抽象,具有重塑社会关系的权力,例如在社交网站中产生回声室。 为了重新制定社区检测的认识论术语,并提出对模糊运算符的重新考虑,我们利用网络科学文献中的辩论和命题来想象一种“批判的疗法”,包括偏袒,认识论谦卑,反射性和人工性。
图形上的随机过程是模拟诸如流行病等复杂动态系统的强大工具。 最近的工作重点是推理问题,其中旨在估计每个节点的状态,从部分观察节点子集开始。 在这些工作中,该过程的初始状态被假定为随机 i.i.d. over node。 这样的假设在实践中可能不现实,其中一个人可能可以访问影响系统初始状态的每个节点的一组协变量。 在这项工作中,我们将假设一个节点的初始状态是此类协变量的未知函数。 鉴于函数可以用神经网络表示,我们将研究一个模型,其中初始状态由一个简单的神经网络给出 - 特别是作用于已知节点的协方变量的单层感知器。 在贝叶斯语框架内,我们研究这种神经网络的先验信息如何增强初始状态的恢复和传播轨迹。 我们得出混合信念传播和近似消息传递(BP-AMP)算法,该算法处理传播动力学和节点协方差中包含的信息,并且我们针对估计器评估其性能,这些估计器要么只使用传播信息,要么仅使用来自协方变量的信息。 我们表明,在某些机制中,该模型在使用Rademacher分布神经网络权重时可以表现出一阶相变。 这些过渡创造了一个统计到计算的差距,即使BP-AMP算法,尽管理论上有可能完全恢复,但都未能实现它。
大型语言模型(LLM)支持生成式社会模拟,能够捕捉在线社交平台上文化知情、规范引导的互动。我们构建了一个基于Voat的技术社区模拟,Voat是一个类似Reddit的另类右翼新闻聚合和讨论平台,活跃于2014年至2020年。使用YSocial框架,我们用从Voat共享URL中采样的固定技术链接目录(覆盖30多个域)来初始化模拟,并使用MADOC数据集中的样本校准参数以匹配Voat的v/technology。代理使用基础、未经审查的模型(Dolphin 3.0,基于Llama 3.1 8B)和简洁的角色(人口统计、政治倾向、兴趣、教育、毒性倾向)来生成帖子、回复和反应,遵循平台规则进行链接和文本提交、线程回复和日常活动周期。我们运行了一个30天的模拟,并通过比较分布和结构与匹配的Voat数据来评估操作有效性:活动模式、互动网络、毒性和主题覆盖。结果表明熟悉的在线规律:相似的活动节奏、重尾参与、稀疏低聚类互动网络、核心-外围结构、与Voat的主题对齐以及升高的毒性。当前研究的局限性包括无状态代理设计和基于单次30天运行的评估,这限制了外部有效性和方差估计。该模拟生成逼真的讨论,经常包含毒性语言,主要围绕技术主题,如Big Tech和AI。这种方法提供了一个有价值的手段,用于在受控环境中检查毒性动态和测试审核策略。
本文介绍了分布式光纤传感(DFOS)拥塞中的流量状态估计(TSE)方法。 DFOS检测车辆沿光纤的驱动振动,并在时空平面中获得其轨迹。 从这些轨迹中,DFOS为没有死区的实时空间连续交通监控提供了平均速度。 然而,当车辆振动强度因速度缓慢而不够低时,无法获得轨迹,导致平均速度数据中缺少值。 它限制了DFOS在严重拥堵中的适用性。 因此,本文提出了基于数据同化缺失值的估算方法。 我们提出的方法在日本两条高速公路上使用参考数据进行验证。 结果表明,与未缺失值的MAE相比,引用的均值平均速度(MAE)仅增加1.5公里/小时。 这项研究增强了DFOS在实际情况下的广泛适用性。
某些天气制度(WR)与能源短缺的风险较高有关,即 欧洲冬季的封锁制度。 然而,与实施WR和能源部门的相关风险有许多不确定性。 特别是气候变化的影响是未知的。 我们通过研究三种方法上不同的欧洲-大西洋 WR 定义来研究这些不确定性。 我们对这些方法进行彻底验证,并使用ERA5数据分析其方法和时空灵敏度。 此外,我们还研究了基于WR的影响评估的CMIP6模型的适用性。 我们的敏感性评估表明,制度的持久性和发生对方法的微小变化很敏感。 我们表明,所使用的培训期对所发现的制度的持久性和发生产生了非常重大的影响。 对于WR4和WR7来说,这导致政权模式不稳定。 所有调查的CMIP6模型都显示政权的不稳定。 这意味着CMIP6模型机制与我们的基线机制之间的标准化距离超过0.4,或者在视觉上非常不同。 只有聚集在历史CMIP6模型数据的WR4制度与小于0.4的基线机制的标准化距离,并且具有可视可识别性。 WR6的定义超过了所有被调查的CMIP6实验的标准化距离阈值。 尽管所有与WR7定义相聚的CMIP6模型实验与0.4以下的基线机制具有标准化距离,但对机制的目视检查表明不稳定。 由于与 WR 定义相关的巨大不稳定和不确定性,在能源部门的影响模型中应用 WR 时应非常谨慎。
人们对广泛话题的看法往往随着时间的推移而演变,通过与他人的互动。 意见动态模型主要侧重于一维意见,代表一个主题的意见。 然而,对各种主题的意见很少是孤立的;相反,它们可能是相互依存和相关的。 在意见动态的有界信心模型(BCM)中,只有当他们的意见足够相似时,代理人才会相互接受。 我们将具有同步相互作用的经典基于代理的BCM(即具有同步相互作用的Hegselmann-Krause BCM)和具有异步相互作用的Deffuant-Weisbuch BCM扩展到多维设置,其中意见是多维向量,其中意见是多维向量,代表不同主题的意见和不同主题的意见是相互依存的。 为了衡量代理之间的意见差异,我们引入了主题加权不和谐函数,这些函数解释了所有主题中的意见差异。 我们为我们的模型定义了接受性区域,我们使用它们来表征稳态意见簇,并提供计算这些区域的分析方法。 此外,我们在各种网络上用数字模拟我们的模型,从各种分布中提取初始意见。 当初始意见在不同的主题中相互关联时,与基线模型相比,我们的主题加权BCM在瞬态和稳态中产生显着不同的结果,其中每个意见主题的动力学是独立的。
YouTube和Twitter等社交媒体平台在传播有关气候变化的可靠和不可靠信息方面发挥着重要作用。 这项研究分析了Twitter中互动的拓扑结构及其与跨平台共享,内容讨论和情绪反应的关系。 我们研究了四个主题的气候变化讨论:第27届联合国气候变化大会,联合国政府间气候变化专门委员会的第六次评估报告,气候难民和多纳纳自然公园。 虽然转发以回声室的形式加强了群体内的凝聚力,但群体间曝光通过提及非常重要,这表明接触对立的观点会加剧两极分化,而不是减轻两极分化。 意识形态划分的特征内容差异伴随着更陡峭的负面情绪,特别是来自倾向于分享低可靠性信息的右倾社区。 我们确定了平台之间的拓扑对齐,表明意识形态社区跨越多个站点。 我们的研究结果表明,气候变化的两极分化是多方面的,涉及意识形态分歧、结构隔离和情感参与。 这些结果表明,有效的气候政策讨论必须解决公共话语的情感和身份驱动性质,并寻求弥合意识形态分歧的策略。
经济复杂性是评估现代经济体生产能力和未来增长的有力工具。然而,对于经济复杂性在历史长河中如何演变,我们知之甚少。在本文中,我们利用罗马帝国的考古证据——以耐久材料(即铭文)保存的简短文本——来估算帝国各个行省的经济复杂性。通过将铭文文本中列出的职业与铭文物品发现地点联系起来,我们可以估算出罗马帝国最初四个世纪中最复杂的地区与当今最复杂的国家之间存在显著且统计学上显著的重叠。虽然我们无法解释经济复杂性为何能够跨越时代得以保存,但这一证据表明了经济能力发展的难度。
这项工作引入了一个贝叶斯框架,统一了广泛的意见动态模型。 在这个框架中,个人对主题的看法是他们信念的预期值,表示为具有先验分布的随机变量。 在收到信号后,模拟为先验信念加上偏置术语,并带有已知分布的零均噪声,个人通过贝叶斯规则更新其信念分布。 通过系统地改变先前,偏差和噪声分布,这种方法可以恢复广泛的意见动态模型,包括DeGroot,有界置信度,有界移位以及表现出过度反应或适得其反效应的模型。 我们的分析显示,信号得分是每个模型数学结构的关键决定因素,支配着小信号和大信号行为。 所有模型都收敛到DeGroot对小信号的线性更新规则,但对大信号的尾部行为有分歧。 这种统一不仅揭示了以前脱节的模型之间的理论联系,而且还提供了一种产生新模型的系统方法,为在认知约束下形成意见的理性基础提供了见解。
高性能图形库(如GraphBLAS)的出现使大规模网络数据集得以分析,并揭示了它们行为的新模型。 复杂网络行为的物理类比对于理解这些新发现的网络现象是一种有用的帮助。 以前的工作利用了规范的Gull's Lighthouse问题,并开发了一种计算启发式,用于使用此模型对大规模网络流量进行建模。 使用这种方法的一般解决方案需要克服由此产生的微分方程中的基本数学奇点。 进一步的调查揭示了一种更简单的物理解释,减轻了解决具有挑战性的微分方程的需要。 具体来说,在时间t时在时间“距离”r(t)处观察源的概率是p(t)∝ 1/r(t)^2。 这种类比与许多物理现象一致,可以成为直觉的丰富来源。 将这种物理类比应用于匿名网络传感图形挑战数据中观察到的源相关性,导致一个优雅的网络轨道类比,可能有助于理解网络行为。
书目方法为评估跨学科的科学生产力和影响提供了宝贵的工具,但它们在天文学期刊中的应用仍然相对有限。 这项研究对斯巴鲁望远镜的调试前后日本天文学出版物进行了文献学分析,斯巴鲁望远镜是国家对观测基础设施的重大投资。 使用Scopus和SciVal的数据,我们研究了1996年至2007年间由日本机构附属作者发表的同行评审期刊文章,重点关注现场标准化的引文指标,如现场加权引文影响(FWCI)和出版物在前10名中的份额。
一般来说,网络按程度分布的类型分为节点链接数量之间的不平等和平等两个方面。 一方包括许多社会,技术和生物网络,这些网络由几个具有许多链接的节点和许多具有几个链接的节点组成,而另一侧由具有相同数量链接的所有节点组成。 在它们之间的综合调查中,我们发现,作为一个更加平等的网络,整个连接的容忍度更强,而不会对广泛类随机网络中节点的故障产生碎片化。 然而,我们新发现,如果添加一个强大的模块化(或社区)结构,包括它们之间的典型知名网络结构,包括它们之间的所有网络都变得极其脆弱,具有领域,利益,宗教,目的等的共性。 这些结果将通过连接节点并考虑到弱社区内部和相互联系之间的平衡资源分配来鼓励避免过于密集的工会。 我们必须不仅重新考虑效率,而且要对袭击或灾难的容忍度,除非没有真正不可能的社区。
80年代末到00年代中期的可扩展计算革命为计算创造了一种新的技术和经济模式,产生了巨大的社会影响,但其经济效益推动了现在耗尽能源电网容量的可扩展性。 我们的时代需要一场可扩展能源的新革命,以关键的方式反映可扩展的计算革命;例如,令人信服的经济力量,使用大众市场组件,克服这些组件的弱点,明智地使用物理环境,以及难以集成到一个有效的系统中。 离网AI方法与这个模式密切相关,将本地大部分可再生能源发电和存储相结合,为AI数据中心供电,开始离网。 实现这种方法的障碍是社会,技术和项目,但潜力巨大。 我认为,离网-AI方法需要系统开发人员和AI-数据中心运营商的先驱,才能将其从概念快速转移到大规模部署。
我们将人类移动性建模为组合分配过程,将旅行视为分配给位置垃圾箱的可区分球,并生成起源目的地(OD)网络。 从这个类比中,我们构建了一个统一的三尺度框架,枚举,概率和连续图集合,并证明了一个重规范化定理,表明在大型稀疏机制中,这些表示收并成为一个普遍的混合Poisson定律。 该框架为关键可移动性可观察因素提供了紧凑的公式,包括目的地占用、未访问地点的空置、覆盖范围(优惠券收集器问题的停止时间延长)以及超出有限容量的溢出。 使用重力样内核的模拟,根据经验OD数据进行校准,与渐近预测相匹配。 通过将精确的组合模型与连续分析联系起来,结果为合成网络生成、拥塞评估和可持续城市交通政策的设计提供了一个原则性工具包。
优化复杂网络的稳定性和控制性能通常取决于有效识别关键节点以进行有针对性的干预。 由于其固有的复杂性和高维度,在电网,交通和金融系统等领域普遍存在的大规模能源流网络在选择资源分配的最佳节点方面提出了独特的挑战。 虽然已经提出了许多中心性测量,如Katz中心度,特征中心中心度,紧密性中心性,以及PageRank,以评估节点重要性,但不同中心度指标对稳定性结果的影响仍然知之甚少。 此外,网络表现出不同的结构特征 - 包括小世界,无尺度和随机图属性 - 这进一步使优化问题复杂化。 本文系统地研究了各种节点中心度测量如何影响具有代表性的复杂网络结构的控制稳定性。 开发了统一的能量流动力学模型,并使用L1规范等性能指标来量化使用不同中心度指标的网络稳定性影响。 统计生成的网络集成的广泛数值模拟揭示了稳定性结果的显着差异,突出了中心度选择的关键作用。 研究结果强调了能量流稳定性对拓扑节点排名中看似微小的变化的敏感性,为提高现实世界网络系统的控制效率和稳健性提供了实用的见解。
事物如何传播的模型通常假设传输机制是随着时间的推移而固定的。 然而,社会传染——思想、信仰、创新的传播——在传播时可能会失去或获得动力:思想可以得到加强,信念得到加强,产品得到完善。 我们研究这种自我强化机制在级联动力学中的影响。 我们使用不同的数学建模技术来捕捉过程的递归性,但变化的性质。 我们发现一个具有一系列功率法级联大小分布的关键机制,具有非通用缩放指数。 这个制度与经典模型发生冲突,其中关键性需要在精确的临界点进行微调。 自我强化级联在广泛的参数上产生类似临界的行为,这可能有助于解释经验社会数据中权力法分布的普遍性。
研究人员的排名小组在几个背景下都很重要,可以发挥许多目的,例如根据科学家的出版物产出公平分配赠款,研究项目的让步,期刊编辑委员会的分类以及社会背景下的许多其他应用。 在本文中,我们提出了一种测量研究人员群体表现的方法。 提出的方法称为α-index,它基于两个参数:(i)组中研究人员h-index的同质性;(ii)h-group,这是h-index对组的扩展。 我们的方法将 h-index 的同质性和绝对值的概念集成到一个适合评估组的单一度量中。 我们报告基于其计划委员会成员的h索引评估计算机科学会议的实验。 我们的结果类似于研究机构采用的手动分类方案。
社会认同论(SIT)和社会分类理论(SCT)是理解社会现象的社会认同方法(SIA)的两个方面。 SIT和SCT是描述和解释人们如何在社交上相互作用的模型,通过了解潜在的心理机制和群体间行为将个人与群体联系起来。 SIT最初开发于20世纪70年代,SCT,一个后来的,更普遍的分支,已经广泛应用于人们之间的一系列社会现象。 日常生活中越来越多的社交机器的兴起,摒弃了在理解人工代理人是否能够以及如何参与SIA活动方面的努力。 随着社交机器人和聊天机器人等由复杂的大型语言模型(LLM)提供动力的代理,了解这些技术作为社会实体的真实和潜在角色至关重要。 在这里,我提供了一个关于SIA和外推的引物,通过案例研究和想象的例子,SIT和SCT如何应用于人工社会代理。 我强调,并非所有的人类模型和子理论都将适用。 我进一步认为,鉴于这些机器的新兴能力以及我们被它们所接受的倾向,我们专家可能需要为了我们自己的利益而戴上不可思议的杀人狂的帽子。