技术文档

 

1.  1  建设背景:

 

随着语音技术的研究,对情感语音的研究已经越来越引起众多研究者的兴趣。传统的语音处理系统多着眼于语音词汇传达的准确性,而忽略了包含在语音信号中的情感因素。它只是反映了信息的一个方面,而忽略了与知识世界相对应且具有同等重要地位的感性科学世界,而这也是信息处理的一个重要组成部分。因此情感特征的人工处理,在信号处理和人工智能等领域具有重要意义。

 

2.  2  建设目标:

 

通过建设该语料库,我们可以分析不同情感状态下韵律特征与声学特征的不同表现,也可以供情感识别和情感合成的研究工作。

 

3.  3  设计构成

 

在我们的语料设计中,共有5种情感考虑在内,分别是高兴、悲哀、生气、惊吓、中性。每种情感有500句语料,其中前300句是相同文本的,也即是说对相同的文本赋以不同的情感来阅读,这些语料可以用来对比分析不同情感状态下的声学及韵律表现;另外100句是不同文本的,这些文本从字面意思就可以看出其情感归属,便于录音人更准确地表现出情感。

 

 

4、录制环境:

 

在纯净录音环境进行数据采集,信噪比约为35db

 

5、存储格式

 

16000采样率,16bitpcm格式存储