Page 118 - 201806
P. 118
948 2018 年 11 月
进行了听辨对比。最后,利用主观数据验证了特殊
1 引言
发音的情感表现力,并总结了特殊发音在语气词中
日常对话中经常使用到语气词。语气词在情态 的应用条件。将这种方法应用到合成语音中,可以
语气范畴中有表义功能、完句功能 [1] 。它能够表达 弱化用户对合成语音的乏味感,取悦用户,让用户获
说话人的情感和反映说话人的意愿、态度以及评价, 得良好的语音交互体验。论文的研究结果可以为语
是人类情感表达的具体方式 [2] 。现代汉语中六个典 音交互的情感设计提供指导思路。
型语气词“的、了、吗、吧、啊、呢”派生出许多新的形
式,如 “呀、啦、哈” 等语气词 [3] 。孙锡信 [4] 指出,近
2 语气词特殊发音的基频分析
代汉语文本中最常用的语气词都是 a 系语气词,即
都带 a 音或者主要元音都是 a 的语气词。普通话是
2.1 建立普通话特殊发音语料库
以北方话为基础方言,以典范的现代白话文著作为
为了分析语气词特殊发音的基频信号,获取语
语法规范的现代标准汉语,包含阴平、阳平、上声、去
声四种声调。而在生活中受特定环境因素的影响, 气词特殊发音的方式,首先建立中文语气词特殊发
说话人为了表现主观情绪,语气词的发音结合两种 音数据库。目前世界上获取语音数据的方式主要有
声调形成特殊发音。例如演员为了增加表演的趣味 表演数据和激励数据,由于表演数据易获取、可控
性,在一句台词的末尾加上特殊发音的语气词,引起 制、情感表达较明显,因此选择表演数据。挑选十名
观众大笑。观众通过演员传递的语音信息已感受到 发音清晰、普通话标准的人员录制特殊发音。男女
台词文本内容的趣味性,而结尾处语气词因其特殊 各五名,录制语料文本取自节目台词:“人的一生很
的发音增加了整句台词的趣味性,强化了表演的情 短暂,有的时候跟睡觉是一样的,眼睛一闭,一睁,一
感表达。 天过去了 hao” 。由于特殊发音的声调不在四个声
语音信号主要包含语义和声学信息,在声学研 调范围内,不能界定是哪一个汉字,故取汉字拼音作
究中基频 (F 0 ) 是重要的参数 [5] ,决定了发音的音 为发音语料,且设定语气词为一个字。要求训练语
调。在常见的韵律特征中基频相关特征有基音频率 料录制人员模仿原本节目中演员的发音方式进行
及均值、变化范围、变化率和均方差等 [6] 。情感语音 语料库的录制。每人录制十次,为了让语料录制人
传递的信息包含语言信息、副语言信息和非语言信 员模仿得更像,要求说出整段台词,该段台词的前
息,副语言信息是说话人下意识控制的,非语言信息 半部分用于酝酿情感,特殊发音语气词在后半部分,
表现说话人的心理和物理状态 [7] 。
为使特殊发音具有一定代表性,提取台词后半部分
在合成语音中,基频 (F 0 ) 是声学研究的一个重
的语气词特殊发音作为研究对象,建立特殊发音语
要参数,它决定了声音的高低 [8] 。基频的提取方法
料库。
主要有时域的算法、频域算法、统计方法等 [9] 。由基
设定平常说话的情感为中立情感,用普通话以
频合成语音的方法有基于目标逼近特征的基频建
中立情感说出整段台词,作为研究对象的语气词也
模方法,使合成语音有更好的情感表现力;时域信
以中立情感的说话方式进行发音,只提取该段话的
号调制的方法,提高相位连续性 [10] ;改进的即时域
语气词发音建立中立发音语音库;录制作为研究对
同步叠加固定合成方法,提高合成语音韵律修改能
象的语气词的阴平发音作为特殊发音的基频参考
力 [11] 。以上方法较好地改善了合成语音的自然性
语料。
以及提高了特定情感语音的表现能力,但对于语气
词特殊发音的合成和情感表现没有研究。 在安静的实验室环境下进行数据库的录制,采
为了研究语气词特殊发音的情感表现能力,论 用Adobe Audition CS6 录音软件、SGC-598语音传
文首先建立了特殊发音语料库,提取特殊发音基频 输设备,录音采用 Conexant SmartAudio HD 声卡,
特征进行研究,分析了特殊发音的基频随时间变化 声音的格式为 16 kHz,单声道,16 bit。得到小规模
的关系规律,获得一种语气词特殊发音的方式。之 的特殊发音数据库,共包含单个字特殊发音 200 个,
后,以阴平发音为基础,将该特殊发音合成到不同语 单个字中立发音 200 个,阴平发音 200 个,最终获得
气词的发音中,生成含有特殊发音语气词的语音,并 样本数据600个。