活水快报 - 42Digest

大型语言模型代理社会模拟的操作验证：来自Voat v/technology的证据

Operational Validation of Large-Language-Model Agent Social Simulation: Evidence from Voat v/technology

Aleksandar Tomašević, Darja Cvetković, Sara Major, Slobodan Maletić, Miroslav Anđelković, Ana Vranić, Boris Stupovski, Dušan Vudragović, Aleksandar Bogojević, Marija Mitrović Dankulov

arXiv

2025年8月29日

大型语言模型（LLM）支持生成式社会模拟，能够捕捉在线社交平台上文化知情、规范引导的互动。我们构建了一个基于Voat的技术社区模拟，Voat是一个类似Reddit的另类右翼新闻聚合和讨论平台，活跃于2014年至2020年。使用YSocial框架，我们用从Voat共享URL中采样的固定技术链接目录（覆盖30多个域）来初始化模拟，并使用MADOC数据集中的样本校准参数以匹配Voat的v/technology。代理使用基础、未经审查的模型（Dolphin 3.0，基于Llama 3.1 8B）和简洁的角色（人口统计、政治倾向、兴趣、教育、毒性倾向）来生成帖子、回复和反应，遵循平台规则进行链接和文本提交、线程回复和日常活动周期。我们运行了一个30天的模拟，并通过比较分布和结构与匹配的Voat数据来评估操作有效性：活动模式、互动网络、毒性和主题覆盖。结果表明熟悉的在线规律：相似的活动节奏、重尾参与、稀疏低聚类互动网络、核心-外围结构、与Voat的主题对齐以及升高的毒性。当前研究的局限性包括无状态代理设计和基于单次30天运行的评估，这限制了外部有效性和方差估计。该模拟生成逼真的讨论，经常包含毒性语言，主要围绕技术主题，如Big Tech和AI。这种方法提供了一个有价值的手段，用于在受控环境中检查毒性动态和测试审核策略。

Large Language Models (LLMs) enable generative social simulations that can capture culturally informed, norm-guided interaction on online social platforms. We build a technology community simulation modeled on Voat, a Reddit-like alt-right news aggregator and discussion platform active from 2014 to 2020. Using the YSocial framework, we seed the simulation with a fixed catalog of technology links sampled from Voat's shared URLs (covering 30+ domains) and calibrate parameters to Voat's v/technolog...

计算机与社会社会与信息网络物理学与社会

View Source