42digest首页
SugarTextNet:一个基于变压器的框架,用于检测社交媒体上的糖约会相关内容与上下文感知的Focal损失

SugarTextNet: A Transformer-Based Framework for Detecting Sugar Dating-Related Content on Social Media with Context-Aware Focal Loss

Lionel Z. Wang, Shihan Ben, Yulu Huang, Simeng Qin

arXiv
2025年11月9日

与糖约会相关的内容在主流社交媒体平台上迅速激增,引起了严重的社会和监管问题,包括亲密关系的商业化和交易关系的正常化。 检测这些内容极具挑战性,这是由于现实世界数据中微妙的委婉语、模棱两可的语言线索和极端的阶级不平衡。 在这项工作中,我们介绍了SugarTextNet,这是一个基于变压器的新型框架,专门用于识别社交媒体上的糖约会相关帖子。 SugarTextNet集成了一个预训练的变压器编码器,一个基于注意力的提示提取器和一个上下文短语编码器,以捕获用户生成文本中的突出和细微特征。 为了解决类失衡并增强少数群体类检测,我们引入了Context-Aware Focal Loss,这是一种量身定制的损耗函数,将焦点损失缩放与上下文加权相结合。 我们在新浪微博新编的3,067篇中国社交媒体帖子中新编的手动注释数据集上评估SugarTextNet,证明我们的方法大大优于传统的机器学习模型,深度学习基线和跨多个指标的大型语言模型。 综合消融研究证实了每个组成部分不可或缺的作用。 我们的研究结果强调了特定领域、上下文感知建模对敏感内容检测的重要性,并为复杂、真实场景的内容审核提供了强大的解决方案。

Sugar dating-related content has rapidly proliferated on mainstream social media platforms, giving rise to serious societal and regulatory concerns, including commercialization of intimate relationships and the normalization of transactional relationships. Detecting such content is highly challenging due to the prevalence of subtle euphemisms, ambiguous linguistic cues, and extreme class imbalance in real-world data. In this work, we present SugarTextNet, a novel transformer-based framework spec...