2005年度863计划 语音识别评测数据

评测数据

数据格式

测试语料描述

数据规模

开发单位

评测语料

Wav文件

包括桌面语音、电话语音两部分。

桌面语音:

语种:汉语

类型:朗读句子

录音环境:带噪声的真实场景

规模:训练集、开发集、测试集各1小时。100人,其中训练集50人,32男,18女;开发集25人,14男,11女;测试集25人,16男,9女。各集合的说话人无重复。每个集合都是1小时,训练集417句,开发集434句,测试集431句,共1282句,所有句子语料无重复。

格式:16K16位,PCM编码

答案:纯文本格式,为每个句子对应的文本。

 

电话语音:

语种:汉语

  类型:双人自然对话

录音环境:一端为实验室安静环境,一端为真实场景。

规模:训练集5小时,38段对话;开发集1小时,8段对话;测试集1小时,7段对话。各集合的说话人无重复。

格式:8K16位,PCM编码

答案:训练集为转写的文本,带时间点和说话人、非语音等信息;开发集和测试集带关键词点和关键词标注信息。

 

桌面:329M

电话:398M

 

 

 

参考答案

Txt文件

桌面:270K

电话:757K

 

评测工具

桌面:

exe文件

电话:

Matlab源码

(包含NISTDETWare

桌面:300K

电话:83.8K