汉语普通话语音合成语音库

(基本库)

 

(1) 资源名称

自有汉语普通话语音合成数据库

(2) 资源简述

此数据库为汉语普通话语音库,共包括11万字,整理为20个文本,分别为语句、数字串、生僻字、字母串、度量单位、轻声、儿话、希腊字母、疑问句、英文单词、模拟预订客房。录制产生的声音文件为44.1k采样频率、16bit量化精度的WINDOWS PCM WAV文件。共两个通道,一个通道为语音波形信号,另一个通道为声门波信号(语音基频信号)。语音库主要用于汉语普通话语音合成的测试和训练。

(3) 单位名称

天籁数据中心

(4) 开发时间

二零零一年

(5) 规模

 

数据库包括11万字,分为20个文本。共12,679WAVWindows PCM)文件,5.67G,合计9.89小时(单通道)。文本内容如下:

文本类型

例 句

语句文本

100006   中国政府顺利恢复对香港行使主权

zhong1 guo2 zheng4 fu3 shun4 li4 hui1 fu4 dui4 xiang1 gang3 xing2 shi2 zhu3 qvan2

数字串文本

109500   三零一

          san1 ling2 yi1

生僻字文本

109786   他把竹竿拗断了。

          ta1 ba3 zhu2 gan1 ao3 duan4 le5

字母串文本

110050   EXG

度量单位文本

111250   二十四海里

          er4 shi2 si4 hai2 li3

轻声文本

112071   我发结巴这个词

          wo3 fa1 jie1 ba5 zhe4 ge5 ci2

儿话文本

112451   我发老这个词

          wo3 fa1 laor3 zhei4 ge5 ci2

希腊字母文本

112754   ξ

疑问句文本

112775   赵庆要去售票处吗?

          zhao4 qing4 yao4 qv4 shou4 piao4 chu4 ma5

模拟预订客房文本

113134   是标准间吗?小姐。

          shi4 biao1 zhun3 jian1 ma5 xiao2 jie3

英文单词文本

113768   Application