技术文档
一、建设背景:
对于朗读语气陈述句的语音合成技术已日趋成熟,目前人们已经开始拓展语音合成研究的对象。疑问句与陈述句在语调表现上即有很多相同点又存在很大差异,因此对疑问句语调的研究正是拓展语音合成思路的一个很好的切入点。
二、建设目标:
通过建设该语料库,可以很好的分析疑问句的语调变化规律、疑问句与陈述句的相似与不同之处。因此,该语料应该涵盖各种常见的疑问句式,同时为了便于分析,尽量选用句法结构简单、比较短的句子。
三、语料库设计构成:
语料库组成如下图所示:
以“吗”为结尾的是非问句 以“呢”为结尾的特指问句 包含其他疑问语气词的疑问句 选择问句 无标疑问句
下面进行逐一简介
3.1 有标疑问句
存在有表示疑问语气的语法标记词的疑问句,即称为有标疑问句。
常见语法标记词: “吗” “呢” “为什么” “什么” “怎么样”
特点:基频曲线没有明显的上倾趋势,而且经常出现类似于陈述句的下倾趋势.
3.1.1 以“吗”为结尾的是非问句(1-150)
实例: 你具备侦探才能吗?
这些事件都是偶然的巧合吗?
3.1.2 以“呢”为结尾的特指问句(150-300)
实例: 你要弥补的是什么呢?
你为什么不带她去看医生呢?
3.1.3包含其他疑问语气词的疑问句(300-450)
实例: 您什么时候见过六个指头的天使?
您真的读过这么多书?
3.1.4选择问句(550-590)
实例: 来的是一个女子还是一个男人?
3.2 无标疑问句(450-550)
不在有表示疑问语气的语法标记词的疑问句,即称为无标疑问句。
在无标疑问句中,由于没有标记疑问语气的语法词,只能使用语气的上倾来表达疑问语气.
实例: 你妈妈知道你抽烟?
你喜欢打网球?
另外,我们通过在以上文本中删去疑问语气词得到该疑问句所对应的陈述句,也进行语音录制,通过这样的分析对比,我们可以更加详细地了解疑问句与陈述句在语调表现上的不同。
四、录制环境:
在纯净录音环境进行数据采集,信噪比约为35db。
五、存储格式
以16000采样率,16bit,pcm格式存储