CASIA98-99语音测试库标注规范

一、       CASIA98语音测试库

 

1. 数据内容:

 

选取男声说话人13人,女声说话人10人,每人60句话。共有句子1380句。

数据大小160M,约1.5小时语音。

采样率16KHZ,量化级别 16位线性,存储格式PCM方式。

 

2. 目录结构:

 

CASIA98语音测试库根目录下有23个以f或m开头的文件夹,分别对应23名说话人。其中男声以m开头,女声以f开头,后面跟的字符串为说话人的姓名缩写。

人名目录下包含该录音人所录所有语音文本的文件“STN.TSH”和数据目录STN。录音人的每一个语音数据文件(句子)的对应的录音文本保存在数据目录STN中。

 

3. 数据目录下文件命名规则:

 

语音文件STN#.wav

脚本文件STN#.txt

#从1到60)

 

4. 录音文本格式说明:

 

录音文本的格式为一行汉字一行拼音的格式,示例:

在参议院获得了相对多数的议席
zai4 can1 yi4 yuan4 huo4 de2 le5 xiang1 dui4 duo1 shu4 de5 yi4 xi2

拼音使用国标,调值采用0-4标识:0-轻声;1-阴平;2-阳平;3-上声;4-去声

 

5. 语料的选取

 

语料全部选取自863语音库,随机抽取1200句作为原始录音文本。

 

二、       CASIA99语音测试库

 

1. 数据内容:

 

选取男声说话人5人,每人4组脚本,每组脚本30句话。共有句子600句。

数据大小73M,约40分钟语音。

采样率16KHZ,量化级别 16位线性,存储格式PCM方式。

 

2. 目录结构:

 

CASIA99语音测试库根目录下有20个文件夹,对应5名说话人每人4组录音脚本。5名说话人均为男声。

人名目录下包含该录音人所录所有语音文本的文件“STN.TSH”和数据目录STN。录音人的每一个语音数据文件(句子)的对应的录音文本保存在数据目录STN中。

 

3. 数据目录下文件命名规则:

 

语音文件STN#.wav

脚本文件STN#.txt

#从1到60)

 

4. 录音文本格式说明:

 

录音文本的格式为一行汉字一行拼音的格式,示例:

在参议院获得了相对多数的议席
zai4 can1 yi4 yuan4 huo4 de2 le5 xiang1 dui4 duo1 shu4 de5 yi4 xi2

拼音使用国标,调值采用0-4标识:0-轻声;1-阴平;2-阳平;3-上声;4-去声

5. 语料的选取

 

语料全部选取自863语音库,随机抽取600句作为原始录音文本。