活水快报 - 42Digest

MAVos-DD:多语言音频-视频开放设置深度伪造检测基准

MAVOS-DD: Multilingual Audio-Video Open-Set Deepfake Detection Benchmark

Florinel-Alin Croitoru, Vlad Hondru, Marius Popescu, Radu Tudor Ionescu, Fahad Shahbaz Khan, Mubarak Shah

arXiv

2025年5月16日

我们提出了第一个大规模开放设置基准的多语言音频视频深度伪造检测。我们的数据集包括超过250小时的8种语言的真实和虚假视频,每种语言60个,假视频由七个不同的deepfake生成模型生成,根据生成内容的质量选择。我们组织训练、验证和测试拆分,以便在训练期间只提供所选生成模型和语言的一个子集,从而创建几个具有挑战性的开放式评估设置。我们用最近文献中提出的各种预先训练和微调的deepfake探测器进行实验。我们的结果表明,最先进的探测器目前在我们的开放式场景中进行测试时无法保持其性能水平。我们公开发布我们的数据和代码:https : / /huggingface.co/datasets/unibuc-cs/MAVUS-DD。

We present the first large-scale open-set benchmark for multilingual audio-video deepfake detection. Our dataset comprises over 250 hours of real and fake videos across eight languages, with 60 each language, the fake videos are generated with seven distinct deepfake generation models, selected based on the quality of the generated content. We organize the training, validation and test splits such that only a subset of the chosen generative models and languages are available during training, thu...

计算机视觉与模式识别人工智能机器学习多媒体

View Source