WCSC概述

 

1)项目名称(中、英文)

WCSC——汉语普通话两音节语音语料库

WCSC——Word Corpus of Standard Chinese

 

2)项目简述

汉语普通话两音节语音语料库由汉语两音节语音数据、两音节语料表及管理软件组成,适用于语言语音研究、语音工程开发和基础汉语普通话教学等领域。

    该语音语料库的语料内容结合学术和工程需求,经过科学的研究、论证、设计而成,覆盖汉语普通话常用词和各种声韵、声调和音联组合。两音节语音数据由精选的北京地区男性发音人标准普通话录音资料及其波形和宽带、窄带共振峰语谱图组成。发音人发音三千多组,声音文件采用高质量16KHZ采样16位数据单声道WAV格式存储,语谱图文件采用JPG图形文件存储,库容量约100MB。

语音语料库管理软件PreSpeech主要包含语音和语谱数据库的增删、语音播放、语谱显示、资料查询、查询条件订制、数据转存和数据编辑等功能,可以使用户实现对数据库资料的充分管理和利用。

 

3)单位名称(中、英文)

中国社会科学院语言所北京建国门内大街5号   中国社会科学院语言所语音研究室

邮政编码:100732

电话:(+86-010-65237408 / 85195394

Phonetics Lab, Institute of Linguistics, Chinese Academy of Social Sciences

5 Jian Guo Men Nei Da Jie, Beijing 100732
CHINA
Phone: +86-10-6523 7408
Fax: +86-10-85195396
E-mail: liaj@cass.org.cn

4)开发时间

1999年至2001年月

 

5)规模

WCSC由精选的北京地区男性发音人标准普通话录音资料及其波形和宽带、窄带共振峰语谱图组成。发音人发音三千多组,声音文件采用高质量16KHZ采样16位数据单声道WAV格式存储,语谱图文件采用JPG图形文件存储,库容量约100MB。

 

6)定价

[见价格表]

7)相关技术文档(见METADATA目录)

WCSC-管理软件PreSpeech使用说明》

WCSC录音和存储规范》

WCSC语料设计规范》

8)语音库样例

WCSC样例