技术文档

 

1.建设背景:

 

随着信息化时代的来临,人们对语音技术的需求越来越迫切,而同时伴随着电子计算机的飞速发展,语音合成的技术也获得了极大的提高,已逐渐达到可商用的程度。目前基于大语料库的语音合成技术也已经成为语音合成的主流技术,而大型语音合成语料库,作为该技术的基础,对最终语音合成的质量起着尤为重要的作用。

 

2.建设目标:

 

为了提高最终的合成语音的质量,在语料库建设中应该考虑要覆盖普通话发音中所经常出现的语音学现象,包括变调现象、协同发音现象等等,只有这样,在最后合成中,才能达到比较好的效果。

 

3.语料库设计构成:

 

该语料库是根据一定规则使用贪心算法从十年的读者文摘和人民日报中自动挑选出来的,我们使用的规则包括声调组合、声韵母组合、音节组合等等,保证在最后的语料中可以覆盖所有的普通话音节、超过90%的二字组,以及所有的声调组合。这样的设计使得最终的语料库中包含有各种的声学现象和韵律现象,这也就保证了最后的合成语音不会过于单调。

 

4.录音设备:

 

在纯净录音环境进行数据采集,信噪比约为35db

 

5.语音文件存储格式:

 

语音合成库以16KHz采样16bit精度,WaveTag格式分别存储;文本数据以TXT格式存储。