(1)   资源名称(中、英文)

中英文混读语音语料库

Chinese and English speech Corpus

 

2)资源简述(中、英文)

863计划的支持下,研究和建立一个供语音合成的研究、开发和评测用的中英文混读语音语料库。语料库的内容包括:声音质量高的语音数据和相应的文本、和标注数据。本课题完成后,可以提供一共供中英文语音合成、韵律建模、语料库标注方法探索方面可以使用的音库。可以通过双语种基础语料库的建设,推动国际间在相关领域的技术合作和探讨。



Under the support of the-863-project, Building the bilingual speech corpus for TTS tech researchsystem development and evaluation to synthesis speech. The corpus include high quality speech data and corresponding textlabeling information in prosodic and phonemic field. The corpus can be used in text to speech researchprosody modeling and auto-labeling speech corpus research. And at the same time the corpus is expected for prompting international technical corporation in speech synthesis research field.

 

3)单位名称(中、英文)

科大讯飞信息科技公司Anhui USTC iflytek information technology company

4)开发时间

2003/1~2003/7

5)规模

包括男女声两个资源库、每个库包含中文(600句)、英文(1003句)。中英文混合(1306句)语音数据、同时包含语音数据相关的音段、韵律标注数据;