SCSC说明

 

1.SCSC简介

   

SCSC汉语普通话单音节语音语料库(Syllable Corpus of Standard Chinese)由汉语单音节语音数据、单音节表及管理软件组成,适用于语言语音研究、语音工程开发和基础汉语普通话教学等领域。

该语音语料库的语料内容结合学术和工程需求,经过科学的研究、论证、设计而成,覆盖汉语普通话最常用音节和各种声韵、声调组合。语音数据部分由精选的15位北京地区男性发音人标准普通话录音资料整理组成,每人发音1275个音节,声音文件采用高质量16KHZ采样16位数据单声道WAV格式存储,库容量约250MB。语音语料库管理软件preSpeech主要包含语音数据库的增删、语音播放、资料查询、查询条件订制、数据转存和数据编辑等功能,可以使用户实现对数据库资料的充分管理和利用。

更多信息请参考SCSC概述文件(..\DOC\OVERVIEW.doc)

   

2.目录结构

 

SCSC的目录结构和说明如下:

1)              ..\DATAANNO   

声音数据目录,其中有M01到M15共计15个目录,每个目录中存储有一位发音人的声音数据(后缀为.wav)和发音人信息(后缀为.dat)。

关于声音数据的详细说明,请参考SCSC录音规范(..\METADATA\ SPECREC.DOC)。

 

2)              ..\DOC

项目说明文档目录,其中有2个MICROSOFT WORD格式文件,分别为:

README.DOC ——即本文件,主要介绍SCSC的组成和各部分目录结构

OVERVIEW.DOC——SCSC项目概述文件。

 

3)              ..\TOOLS

内有SCSC管理软件prjSpeech,安装后使用,主要包含对SCSC语音数据库的增删、语音播放、资料查询、查询条件订制、数据转存和数据编辑等功能,可以使用户实现对数据库资料的充分管理和利用。

具体使用方法,请参考prjSpeech使用说明(..\TOOLS\SOFT-README.DOC)

 

4)              ..\METADATA

    SCSC规范说明目录,其中包含1个MICROSOFT WORD格式文件:

SPECREC.DOC——介绍SCSC的录音和存储规范。

 

5)              ..\TXT

   SCSC录音内容的文本。SCSC中有部分声音无对应汉字,在文本中显示“??”符号,属正常现象。

 

 

  

3.联系方法

更多信息中国社会科学院语言研究所语音研究室

地址:中华人民共和国北京市东城区建国门内大街5号中国社会科学院语言研究所语音研究室

邮政编码:100732

联系电话:(010)81595394

          (010)65237408

 

网址:http://www.cass.net.cn/chinese/s18_yys/yuyin/index.htm

 

(版权声明:本语音语料库版权归中国社会科学院语言研究所语音研究室所有。)