CASIA单音节孤立词语音库说明

 

1、数据库简介:

本数据库分女声语料和男声语料两部分,内容包括字、词、句等。每种语料都包含语音和文本两种数据。其中,女声语料4组,共61人次;男声语料5组,共40人次。数据总量约2G

 

2、数据存放的目录结构:

       数据存放结构如图所示:

数据库分为femalemale两个目录,分别代表女声数据和男声数据。其下又有DR*子目录,代表第*组数据。每组数据下又分为若干个F{name}/M{name}目录。其中F指女声,M指男声;{name}为录音人名,按姓氏全拼、名字各字拼音的首字母缩写命名。每个人名目录下又包含三个子目SYLWRDSTN,分别对应单音节(字)语音数据、词语音数据和句子语音数据;同时该目录下还包含三者的对应脚本(Transcript)文件SYL.tshWRD.tsh以及STN.tsh,用以存储对应语音的文本内容。

例如:../female/DR1/FZHANGL/WRD目录对应于女声第一组数据中女录音人张丽(ZhangLi)所录制的词语音数据。

3.脚本文件格式:

       所有录音人目录下均包含名为SYL.tshWRD.tshSTN.tsh的三个脚本文件,分别用以存储该录音人所录制的字、词、句数据的详细文本内容。

       每个脚本文件内分别记录了该录音人录制的所有字//句的内容,按照一行汉字,一行拼音(每个汉字拼音后均紧跟该汉字的声调,其中音平记为1,阳平记为2,上声记为3,去声记为4,轻声记为0等)的方式存储。

 

4.语音文件命名方式:

       对于每一个录音人录制的语音数据,都按照如下方式命名:

a.  字:命名为SYL{index}.wav,其中SYL代表字,{index}代表序号。如:SYL29.wav文件指该说话人录制的第29个字对应的语音文件。

b.  词:命名为WRD{index}.wav,其中WRD代表词,{index}代表序号。如:WRD130.wav文件指该说话人录制的第130个词对应的语音文件。

c.  句:词:命名为WRD{index}.wav,其中WRD代表词,{index}代表序号。如:STN1.wav文件指该说话人录制的第1个词对应的语音文件。

 

5、波形文件的参数:

所有语音数据均为16KHz采样率,16位采样精度,单通道语音数据。