桌面语音识别语音库——数字串

120人)

 

(1) 资源名称

汉语普通话桌面语音识别语音库

(2) 资源简述

语音库录制120名具有不同口音、年龄和文化层次发音人。产生的声音文件为22.05k采样频率、单声道、16bit量化精度的WINDOWS PCM WAV文件。录音数据采用头戴式抗噪麦克风单信道录制。语音库主要用于自然语音的识别测试和训练。

(3) 单位名称

天籁数据中心

(4) 开发时间

20053-20057

(5) 规模

录音人数:120人,共计:6.2小时  数据量:945 MB22.05K 率)

 

项目内容

具体指标情况

录音人数

120人。其中男性59人、女性61

发音人年龄及性别分布

12~18岁:男性6人;女性6

19~29岁:男性24人;女性25

30~49岁:男性23人;女性24

50~60岁:男性6人;女性6

录音语料内容

每份文本含有30行数字串

口音分布

发音人选自22个省市、自治区

录音技术参数

录音环境:选择环境噪音较小的录音场所

录音平台:本次录音使用的是Windows XP操作系统,外接2.0 USB声卡,并使用头戴式抗噪麦克风进行录音。