2005年度863计划 语音识别评测数据 |
||||
评测数据 |
数据格式 |
测试语料描述 |
数据规模 |
开发单位 |
评测语料 |
Wav文件 |
包括桌面语音、电话语音两部分。 桌面语音: 语种:汉语 类型:朗读句子 录音环境:带噪声的真实场景 规模:训练集、开发集、测试集各1小时。共100人,其中训练集50人,32男,18女;开发集25人,14男,11女;测试集25人,16男,9女。各集合的说话人无重复。每个集合都是1小时,训练集417句,开发集434句,测试集431句,共1282句,所有句子语料无重复。 格式:16K、16位,PCM编码 答案:纯文本格式,为每个句子对应的文本。 电话语音: 语种:汉语 类型:双人自然对话 录音环境:一端为实验室安静环境,一端为真实场景。 规模:训练集5小时,38段对话;开发集1小时,8段对话;测试集1小时,7段对话。各集合的说话人无重复。 格式:8K、16位,PCM编码 答案:训练集为转写的文本,带时间点和说话人、非语音等信息;开发集和测试集带关键词点和关键词标注信息。 |
桌面: 电话: |
|
参考答案 |
Txt文件 |
桌面:270K 电话:757K |
||
评测工具 |
桌面: exe文件 电话: Matlab源码 (包含NIST的DETWare) |
桌面:300K 电话:83.8K |