录音回放说话人身份认证语音数据库
(1) 资源名称
录音回放说话人身份认证语音数据库(APSRD, Authentic
and Playback Speaker Recognition Database)。
(2) 资源简述
该数据库包含了40人的录音,每个人的录音分为三类,原始语音,转录语音,录音回放语音。所有声音文件均为16k采样频率、单声道、16bit量化精度的WINDOWS PCM WAV文件。主要用于精确说话人识别、语音识别、录音回放识别、录音设备源识别。
(3)提供单位名称
华南理工大学电子与信息学院多媒体信息处理实验室
(4)录制时间
2011年5月-2011年12月
(5)数据库规模
录制人员:共40人
录制人员年龄分布:20-35岁
录音人员性别分布:男21人,女19人
录制人员学历:本科生,在读硕士研究生
语音长度:53小时
数据库容量:
录音语料内容:1. 20个孤立词短语。
2. 10个连续数字串,每个数字串包含10个数字。
3. 60个音素和韵律分布平稳的句子。
4. 2篇苏轼的诗词以平常的语速进行朗读。
口音分布:录音人员来自11个省市、自治区
(5)录音技术参数
录音环境:所有的录音都在安静的办公室和实验室环境下录制,静音时背景噪声约-30dB,偶有外部噪声干扰。
录音设备平台:原始语音使用的是Windows XP操作系统的DELL台式电脑,接创新5.1独立声卡,并通过抗噪麦克风进行声音录制;转录语音由三星和索尼录音笔等便携设备录入的录音;回放语音是语音笔直接播放或通过外接功放播放转录语音由创新声卡再次录入的录音。
(7)基金资助
国家自然科学基金“面向多媒体信息检索的语音处理关键技术研究”(60972132)。