Page 147 - 《应用声学》2021年第6期
P. 147

第 40 卷 第 6 期       赵擎华等: 共振峰编辑法区别鼻化元音中口、鼻音共振峰的实证探究                                          943


                                                               文对自然语音完全去除F 2 后前元音/a/的音质变为
             3 分析与讨论
                                                               后元音/ /的结果一致)。
             3.1 实验结果分析                                            为避免因共振峰强度衰减不足,未能使共振峰
                                                               频率发生根本性改变,或使共振峰相对强度的变化
                 通过共振峰编辑法得出的男性发音人口、鼻共
                                                               成为元音音质改变的主要原因,进而影响共振峰频
             振峰分布状态与方强等            [17]  的研究结果基本一致。
                                                               率和调音器官动作特性对应关系的判断,所以本文
             从语图 (图8) 中可以看出,F 1 以下大概 250 Hz附近
                                                               实验中将共振峰能量衰减至完全消除。因北京阳宸
             会出现共振峰,同时 F 1 与 F 2 之间也有可能出现鼻
                                                               IV-12 计算机语音工作站 (V10.5) 每次最多只能衰
             音共振峰。[ã] 的 F 1 与鼻音的 F n1 相距较远,相互
                                                               减 30 dB,故实验时连续衰减两次 (共 60 dB),以达
             叠加的部分少,基本上对 250 Hz 附近的频谱没有
                                                               到完全去除共振峰的效果。
             影响。鼻音共振峰 F n2 与口音共振峰 F 1 、F 2 都比
             较靠近。不同的是,方强等认为第二鼻音峰很难                             3.4  共振峰编辑法区分口鼻共振峰的价值
             在频谱上表现出来,而男性发音人的第二鼻音峰                             3.4.1 对司法话者识别领域的价值

             清晰可见。                                                 实验发现,不同人语音共振峰存在 “形似而质
                 与男性发音人口、鼻共振峰依次交替分布不同,                         异” 的情况。两发音人所发相同鼻化元音的共振峰
             女性发音人在F 1 以下大概250 Hz和600 Hz处存在                    模式相似,在 2.5 kHz 以下均存在 4 个强峰,但共振
             一弱一强两个鼻音共振峰。对于这种现象,Hawkins                        峰 “身份” 属性却存明显相异 (如图 8 所示)。同样,
             等  [16]  认为鼻腔的阻抗在大概 1.5 kHz 以下有多个                 同一人语音共振峰也存在“形异而质似”的情况。同
             低频共振,因此在鼻元音的声谱中有时可以观察到                            一发音人多次所发相同鼻化元音共振峰的分布也
             F 1 附近存在一个以上的鼻音共振峰。                               可能不同。尤其是 F 1 和 F 2 之间鼻音峰的稳定性较
             3.2 共振峰编辑法需去除低频鼻音干扰                               差,存在明显的个体变异。如图 9 所示,男性发音

                 实验中发现,低频共振峰对元音听辨的影响较                                    C-ࠕࣜឦڏ[zjb-[ta].wav] <00:00:0.00036, 14.5 Hz>
             大。尤其是在去除 F 1 附近的共振峰时,感知到语音                              5.0
             最大的变化特征是发闷、发嗡,而不是元音开口度                                  4.0
             的变化。Kiefte 等    [25] 、Andrus [26]  认为通过降低共             ᮠဋ/kHz  3.0
             振峰的振幅来改变元音音质时,低频共振峰同时掩                                  2.0
             盖了高频共振峰,掩蔽效应和共振峰的频谱对比度                                  1.0
             可能都在元音感知中起到一定的作用。为此,本文
             实验中去除了低频鼻音共振峰以消除掩蔽效应。低                                     0    0.05  0.10  0.15  0.20  0.25
                                                                                       ௑ᫎ
             频鼻音峰与舌位的高低、前后并无明显相关性,去                                              (a) ႄভԧᮃ̡ԧᮃ1
             除之后不仅不会影响元音舌位特征的感知,且会使                                      D-ࠕࣜឦڏ[zjb-[ta].wav] <00:00:0.00000, 14.5 Hz>
             听辨过程更加容易,听辨结果也更加可靠。                                     5.0

             3.3 共振峰编辑法需将能量衰减至完全消除                                   4.0
                 影响元音音质的因素不仅有共振峰频率,还有                               ᮠဋ/kHz  3.0
             共振峰的强度。Lindqvist 等        [27] 、Ainsworth 等 [28] 、      2.0
             Aaltonen [29] 、Hedrick 等  [30]  通过语音合成实验发               1.0
             现,随着共振峰相对强度的变化,合成元音的音质
                                                                        0    0.05  0.10   0.15  0.20  0.25
             也会同时发生改变。其中,Ainsworth 的实验表明,                                              ௑ᫎ
             当 F 2 与 F 1 的能量差小于 28 dB 时,F 2 强度的降低                                 (b) ႄভԧᮃ̡ԧᮃ2
             对共振峰频率没有影响,元音音质基本无变化;随着
                                                                    图 9  男性发音人两次所发音节 [ã] 的宽带语图
             F 2 峰强的继续衰减,元音音质先是变得模糊不清,                            Fig. 9 Wide-band spectrogram of the syllable [tã]
             最终变得与剩余F 1 相对应元音的音质相近(这与本                            produced by male speaker twice
   142   143   144   145   146   147   148   149   150   151   152