CASIA98-99语音测试库标注规范
一、
CASIA98语音测试库
1. 数据内容:
选取男声说话人13人,女声说话人10人,每人60句话。共有句子1380句。
数据大小
采样率16KHZ,量化级别
16位线性,存储格式PCM方式。
2. 目录结构:
CASIA98语音测试库根目录下有23个以f或m开头的文件夹,分别对应23名说话人。其中男声以m开头,女声以f开头,后面跟的字符串为说话人的姓名缩写。
人名目录下包含该录音人所录所有语音文本的文件“STN.TSH”和数据目录STN。录音人的每一个语音数据文件(句子)的对应的录音文本保存在数据目录STN中。
3.
数据目录下文件命名规则:
语音文件STN#.wav
脚本文件STN#.txt
(#从1到60)
4. 录音文本格式说明:
录音文本的格式为一行汉字一行拼音的格式,示例:
在参议院获得了相对多数的议席
zai4 can1 yi4 yuan4 huo4 de2 le5 xiang1 dui4 duo1 shu4 de5 yi4 xi2
拼音使用国标,调值采用0-4标识:0-轻声;1-阴平;2-阳平;3-上声;4-去声
5. 语料的选取
语料全部选取自863语音库,随机抽取1200句作为原始录音文本。
二、
CASIA99语音测试库
1. 数据内容:
选取男声说话人5人,每人4组脚本,每组脚本30句话。共有句子600句。
数据大小
采样率16KHZ,量化级别
16位线性,存储格式PCM方式。
2. 目录结构:
CASIA99语音测试库根目录下有20个文件夹,对应5名说话人每人4组录音脚本。5名说话人均为男声。
人名目录下包含该录音人所录所有语音文本的文件“STN.TSH”和数据目录STN。录音人的每一个语音数据文件(句子)的对应的录音文本保存在数据目录STN中。
3. 数据目录下文件命名规则:
语音文件STN#.wav
脚本文件STN#.txt
(#从1到60)
4. 录音文本格式说明:
录音文本的格式为一行汉字一行拼音的格式,示例:
在参议院获得了相对多数的议席
zai4 can1 yi4 yuan4 huo4 de2 le5 xiang1 dui4 duo1 shu4 de5 yi4 xi2
拼音使用国标,调值采用0-4标识:0-轻声;1-阴平;2-阳平;3-上声;4-去声
5. 语料的选取
语料全部选取自863语音库,随机抽取600句作为原始录音文本。