SeniorTalk: A Chinese Conversation Dataset with Rich Annotations for Super-Aged Seniors
Yang Chen and Hui Wang and Shiyao Wang and Junyang Chen and Jiabei He and Jiaming Zhou and Xi Yang and Yequan Wang and Yonghua Lin and Yong Qin
虽然语音技术越来越多地为人口老龄化提供服务,但由于训练数据不足,捕捉老年人特有的声音特征(如presbyphonia和方言变化)的训练数据不足,目前的系统显示出显着的性能差距。 现有老年人语音数据集中关于超龄个体的有限数据,加上过于简单的记录样式和注释维度,加剧了这个问题。 为了解决75岁及以上个人语音数据严重匮乏的问题,我们引入了SeniorTalk,这是一个精心注释的中文口语对话数据集。 该数据集包含101个自然对话的55.53小时语音,涉及202名参与者,确保性别,地区和年龄的战略平衡。 通过跨多个维度的详细注释,它可以支持广泛的语音任务。 我们在扬声器验证,扬声器截然化,语音识别和语音编辑任务方面进行了广泛的实验,为针对这个年龄组的语音技术的发展提供了重要的见解。
While voice technologies increasingly serve aging populations, current systems exhibit significant performance gaps due to inadequate training data capturing elderly-specific vocal characteristics like presbyphonia and dialectal variations. The limited data available on super-aged individuals in existing elderly speech datasets, coupled with overly simple recording styles and annotation dimensions, exacerbates this issue. To address the critical scarcity of speech data from individuals aged 75 a...