42digest首页
大型语言模型代理社会模拟的操作验证:来自Voat v/technology的证据

Operational Validation of Large-Language-Model Agent Social Simulation: Evidence from Voat v/technology

Aleksandar Tomašević, Darja Cvetković, Sara Major, Slobodan Maletić, Miroslav Anđelković, Ana Vranić, Boris Stupovski, Dušan Vudragović, Aleksandar Bogojević, Marija Mitrović Dankulov

arXiv
2025年8月29日

大型语言模型(LLM)支持生成式社会模拟,能够捕捉在线社交平台上文化知情、规范引导的互动。我们构建了一个基于Voat的技术社区模拟,Voat是一个类似Reddit的另类右翼新闻聚合和讨论平台,活跃于2014年至2020年。使用YSocial框架,我们用从Voat共享URL中采样的固定技术链接目录(覆盖30多个域)来初始化模拟,并使用MADOC数据集中的样本校准参数以匹配Voat的v/technology。代理使用基础、未经审查的模型(Dolphin 3.0,基于Llama 3.1 8B)和简洁的角色(人口统计、政治倾向、兴趣、教育、毒性倾向)来生成帖子、回复和反应,遵循平台规则进行链接和文本提交、线程回复和日常活动周期。我们运行了一个30天的模拟,并通过比较分布和结构与匹配的Voat数据来评估操作有效性:活动模式、互动网络、毒性和主题覆盖。结果表明熟悉的在线规律:相似的活动节奏、重尾参与、稀疏低聚类互动网络、核心-外围结构、与Voat的主题对齐以及升高的毒性。当前研究的局限性包括无状态代理设计和基于单次30天运行的评估,这限制了外部有效性和方差估计。该模拟生成逼真的讨论,经常包含毒性语言,主要围绕技术主题,如Big Tech和AI。这种方法提供了一个有价值的手段,用于在受控环境中检查毒性动态和测试审核策略。

Large Language Models (LLMs) enable generative social simulations that can capture culturally informed, norm-guided interaction on online social platforms. We build a technology community simulation modeled on Voat, a Reddit-like alt-right news aggregator and discussion platform active from 2014 to 2020. Using the YSocial framework, we seed the simulation with a fixed catalog of technology links sampled from Voat's shared URLs (covering 30+ domains) and calibrate parameters to Voat's v/technolog...