Page 118 - 201806
P. 118

948                                                                                 2018 年 11 月


                                                               进行了听辨对比。最后,利用主观数据验证了特殊
             1 引言
                                                               发音的情感表现力,并总结了特殊发音在语气词中
                 日常对话中经常使用到语气词。语气词在情态                          的应用条件。将这种方法应用到合成语音中,可以
             语气范畴中有表义功能、完句功能                [1] 。它能够表达         弱化用户对合成语音的乏味感,取悦用户,让用户获
             说话人的情感和反映说话人的意愿、态度以及评价,                           得良好的语音交互体验。论文的研究结果可以为语
             是人类情感表达的具体方式             [2] 。现代汉语中六个典            音交互的情感设计提供指导思路。
             型语气词“的、了、吗、吧、啊、呢”派生出许多新的形
             式,如 “呀、啦、哈” 等语气词         [3] 。孙锡信   [4]  指出,近
                                                               2 语气词特殊发音的基频分析
             代汉语文本中最常用的语气词都是 a 系语气词,即
             都带 a 音或者主要元音都是 a 的语气词。普通话是
                                                               2.1  建立普通话特殊发音语料库
             以北方话为基础方言,以典范的现代白话文著作为
                                                                   为了分析语气词特殊发音的基频信号,获取语
             语法规范的现代标准汉语,包含阴平、阳平、上声、去
             声四种声调。而在生活中受特定环境因素的影响,                            气词特殊发音的方式,首先建立中文语气词特殊发
             说话人为了表现主观情绪,语气词的发音结合两种                            音数据库。目前世界上获取语音数据的方式主要有
             声调形成特殊发音。例如演员为了增加表演的趣味                            表演数据和激励数据,由于表演数据易获取、可控
             性,在一句台词的末尾加上特殊发音的语气词,引起                           制、情感表达较明显,因此选择表演数据。挑选十名
             观众大笑。观众通过演员传递的语音信息已感受到                            发音清晰、普通话标准的人员录制特殊发音。男女
             台词文本内容的趣味性,而结尾处语气词因其特殊                            各五名,录制语料文本取自节目台词:“人的一生很
             的发音增加了整句台词的趣味性,强化了表演的情                            短暂,有的时候跟睡觉是一样的,眼睛一闭,一睁,一
             感表达。                                              天过去了 hao” 。由于特殊发音的声调不在四个声
                 语音信号主要包含语义和声学信息,在声学研                          调范围内,不能界定是哪一个汉字,故取汉字拼音作
             究中基频 (F 0 ) 是重要的参数        [5] ,决定了发音的音            为发音语料,且设定语气词为一个字。要求训练语
             调。在常见的韵律特征中基频相关特征有基音频率                            料录制人员模仿原本节目中演员的发音方式进行
             及均值、变化范围、变化率和均方差等                 [6] 。情感语音       语料库的录制。每人录制十次,为了让语料录制人
             传递的信息包含语言信息、副语言信息和非语言信                            员模仿得更像,要求说出整段台词,该段台词的前
             息,副语言信息是说话人下意识控制的,非语言信息                           半部分用于酝酿情感,特殊发音语气词在后半部分,
             表现说话人的心理和物理状态              [7] 。
                                                               为使特殊发音具有一定代表性,提取台词后半部分
                 在合成语音中,基频 (F 0 ) 是声学研究的一个重
                                                               的语气词特殊发音作为研究对象,建立特殊发音语
             要参数,它决定了声音的高低              [8] 。基频的提取方法
                                                               料库。
             主要有时域的算法、频域算法、统计方法等                   [9] 。由基
                                                                   设定平常说话的情感为中立情感,用普通话以
             频合成语音的方法有基于目标逼近特征的基频建
                                                               中立情感说出整段台词,作为研究对象的语气词也
             模方法,使合成语音有更好的情感表现力;时域信
                                                               以中立情感的说话方式进行发音,只提取该段话的
             号调制的方法,提高相位连续性               [10] ;改进的即时域
                                                               语气词发音建立中立发音语音库;录制作为研究对
             同步叠加固定合成方法,提高合成语音韵律修改能
                                                               象的语气词的阴平发音作为特殊发音的基频参考
             力  [11] 。以上方法较好地改善了合成语音的自然性
                                                               语料。
             以及提高了特定情感语音的表现能力,但对于语气
             词特殊发音的合成和情感表现没有研究。                                    在安静的实验室环境下进行数据库的录制,采
                 为了研究语气词特殊发音的情感表现能力,论                          用Adobe Audition CS6 录音软件、SGC-598语音传
             文首先建立了特殊发音语料库,提取特殊发音基频                            输设备,录音采用 Conexant SmartAudio HD 声卡,
             特征进行研究,分析了特殊发音的基频随时间变化                            声音的格式为 16 kHz,单声道,16 bit。得到小规模
             的关系规律,获得一种语气词特殊发音的方式。之                            的特殊发音数据库,共包含单个字特殊发音 200 个,
             后,以阴平发音为基础,将该特殊发音合成到不同语                           单个字中立发音 200 个,阴平发音 200 个,最终获得
             气词的发音中,生成含有特殊发音语气词的语音,并                           样本数据600个。
   113   114   115   116   117   118   119   120   121   122   123