42digest首页
当回声室崩溃:检查使用特定社区语言后订阅禁令

When the Echo Chamber Shatters: Examining the Use of Community-Specific Language Post-Subreddit Ban

Milo Z. Trujillo, Samuel F. Rosenblatt, Guillermo de Anda Jáuregui, Emily Moog, Briane Paul V. Samson, Laurent Hébert-Dufresne and Allison M. Roth

arXiv
2021年6月30日

社区级禁令是对抗在线骚扰和有害言论的团体的常见工具。 不幸的是,社区禁令的功效仅进行了部分研究,结果好坏参半。 在这里,我们提供了一个灵活的无监督方法,以识别组内语言,并在Reddit社区(subreddit)之前和之后跟踪Reddit上的用户活动。 我们使用一个简单的单词频率差异来识别给定社区中过度代表性的不常见单词,不是作为有害语音的代理,而是作为社区的语言签名。 我们将我们的方法应用于15个被禁止的subreddit,并发现社区响应在subreddits之间和subreddit用户之间是异质的。 顶级用户总体上更有可能变得不那么活跃,而随机用户通常会减少组内语言的使用而不会减少活动。 最后,我们发现一些证据表明禁令的有效性与社区的内容一致。 黑色幽默社区的用户基本上不受禁令的影响,而围绕白人至上主义和法西斯主义的社区的用户受影响最大。 总之,我们的结果表明,禁令并不平等地影响所有群体或用户,并为理解跨社区禁令的效果铺平了道路。

Community-level bans are a common tool against groups that enable online harassment and harmful speech. Unfortunately, the efficacy of community bans has only been partially studied and with mixed results. Here, we provide a flexible unsupervised methodology to identify in-group language and track user activity on Reddit both before and after the ban of a community (subreddit). We use a simple word frequency divergence to identify uncommon words overrepresented in a given community, not as a pro...