电话语音识别语音库——数字串
(座机285人)
(1) 资源名称
汉语普通话电话语音识别语音库
(2) 资源简述
该语音库采用8k采样频率、16bit量化精度、单声道信道录制,其中包括具有不同口音、年龄和文化层次285个录音人;录音数据采用座机及座机免提,其中座机免提有29人。语音库主要用于电话自然语音识别的测试和训练。
(3) 单位名称
天籁数据中心
(4) 开发时间
2004年3月-2004年7月
(5) 规模
录音人数:285人,共计:12.2小时
数据量:669MB(8K 率)
项目内容 |
具体指标情况 |
录音人数 |
共285人。其中男性144人、女性141人 |
发音人年龄 |
青年:年龄约在16-28岁之间,共220人 中年:年龄约在29-45岁之间,共65人 |
发音人性别 |
中年男性:32人;中年女性:33人;青年男性:112人;青年女性:108人 |
录音方式 |
座机:256人、座机免提:29人 |
口音分布 |
发音人选自26个省市、自治区 (除海南省、宁夏回族自治区、青海省、上海市、西藏自治区、台湾地区) |
录音技术参数 |
录音环境:选择环境噪音较小的录音场所 |
录音平台:本次录音使用的是Windows 2000操作系统,在系统机器上安装电话语音卡作为录音软件,并把指定电话线接入电话语音卡上,发音人就可以通过座机拨打指定电话进行录音。 |
|
录音语料内容 |
数字串30句的共199份;25句的共86份 |