电话语音识别语音库——数字串

(座机285人)

 

(1) 资源名称

汉语普通话电话语音识别语音库

(2) 资源简述

该语音库采用8k采样频率、16bit量化精度、单声道信道录制,其中包括具有不同口音、年龄和文化层次285个录音人;录音数据采用座机及座机免提,其中座机免提有29人。语音库主要用于电话自然语音识别的测试和训练。

(3) 单位名称

天籁数据中心

(4) 开发时间

20043-20047

(5) 规模

录音人数:285人,共计:12.2小时  数据量:669MB8K 率)

 

项目内容

具体指标情况

录音人数

285人。其中男性144人、女性141

发音人年龄

青年:年龄约在1628岁之间,共220

中年:年龄约在2945岁之间,共65

发音人性别

中年男性:32人;中年女性:33人;青年男性:112人;青年女性:108

录音方式

座机:256人、座机免提:29

口音分布

发音人选自26个省市、自治区

(除海南省、宁夏回族自治区、青海省、上海市、西藏自治区、台湾地区)

录音技术参数

录音环境:选择环境噪音较小的录音场所

录音平台:本次录音使用的是Windows 2000操作系统,在系统机器上安装电话语音卡作为录音软件,并把指定电话线接入电话语音卡上,发音人就可以通过座机拨打指定电话进行录音。

录音语料内容

数字串30句的共199份;25句的共86份