Page 147 - 《应用声学》2021年第6期

P. 147

第 40 卷第 6 期赵擎华等：共振峰编辑法区别鼻化元音中口、鼻音共振峰的实证探究 943

文对自然语音完全去除F 2 后前元音/a/的音质变为
3 分析与讨论
后元音/ /的结果一致)。
3.1 实验结果分析为避免因共振峰强度衰减不足，未能使共振峰
频率发生根本性改变，或使共振峰相对强度的变化
通过共振峰编辑法得出的男性发音人口、鼻共
成为元音音质改变的主要原因，进而影响共振峰频
振峰分布状态与方强等 [17] 的研究结果基本一致。
率和调音器官动作特性对应关系的判断，所以本文
从语图 (图8) 中可以看出，F 1 以下大概 250 Hz附近
实验中将共振峰能量衰减至完全消除。因北京阳宸
会出现共振峰，同时 F 1 与 F 2 之间也有可能出现鼻
IV-12 计算机语音工作站 (V10.5) 每次最多只能衰
音共振峰。[ã] 的 F 1 与鼻音的 F n1 相距较远，相互
减 30 dB，故实验时连续衰减两次 (共 60 dB)，以达
叠加的部分少，基本上对 250 Hz 附近的频谱没有
到完全去除共振峰的效果。
影响。鼻音共振峰 F n2 与口音共振峰 F 1 、F 2 都比
较靠近。不同的是，方强等认为第二鼻音峰很难 3.4 共振峰编辑法区分口鼻共振峰的价值
在频谱上表现出来，而男性发音人的第二鼻音峰 3.4.1 对司法话者识别领域的价值

清晰可见。实验发现，不同人语音共振峰存在 “形似而质
与男性发音人口、鼻共振峰依次交替分布不同，异” 的情况。两发音人所发相同鼻化元音的共振峰
女性发音人在F 1 以下大概250 Hz和600 Hz处存在模式相似，在 2.5 kHz 以下均存在 4 个强峰，但共振
一弱一强两个鼻音共振峰。对于这种现象，Hawkins 峰 “身份” 属性却存明显相异 (如图 8 所示)。同样，
等 [16] 认为鼻腔的阻抗在大概 1.5 kHz 以下有多个同一人语音共振峰也存在“形异而质似”的情况。同
低频共振，因此在鼻元音的声谱中有时可以观察到一发音人多次所发相同鼻化元音共振峰的分布也
F 1 附近存在一个以上的鼻音共振峰。可能不同。尤其是 F 1 和 F 2 之间鼻音峰的稳定性较
3.2 共振峰编辑法需去除低频鼻音干扰差，存在明显的个体变异。如图 9 所示，男性发音

实验中发现，低频共振峰对元音听辨的影响较 C-ࠕࣜឦڏ[zjb-[ta].wav] <00:00:0.00036, 14.5 Hz>
大。尤其是在去除 F 1 附近的共振峰时，感知到语音 5.0
最大的变化特征是发闷、发嗡，而不是元音开口度 4.0
的变化。Kiefte 等 [25] 、Andrus [26] 认为通过降低共 ᮠဋ/kHz 3.0
振峰的振幅来改变元音音质时，低频共振峰同时掩 2.0
盖了高频共振峰，掩蔽效应和共振峰的频谱对比度 1.0
可能都在元音感知中起到一定的作用。为此，本文
实验中去除了低频鼻音共振峰以消除掩蔽效应。低 0 0.05 0.10 0.15 0.20 0.25
௑ᫎ
频鼻音峰与舌位的高低、前后并无明显相关性，去 (a) ႄভԧᮃ̡ԧᮃ1
除之后不仅不会影响元音舌位特征的感知，且会使 D-ࠕࣜឦڏ[zjb-[ta].wav] <00:00:0.00000, 14.5 Hz>
听辨过程更加容易，听辨结果也更加可靠。 5.0

3.3 共振峰编辑法需将能量衰减至完全消除 4.0
影响元音音质的因素不仅有共振峰频率，还有 ᮠဋ/kHz 3.0
共振峰的强度。Lindqvist 等 [27] 、Ainsworth 等 [28] 、 2.0
Aaltonen [29] 、Hedrick 等 [30] 通过语音合成实验发 1.0
现，随着共振峰相对强度的变化，合成元音的音质
0 0.05 0.10 0.15 0.20 0.25
也会同时发生改变。其中，Ainsworth 的实验表明， ௑ᫎ
当 F 2 与 F 1 的能量差小于 28 dB 时，F 2 强度的降低 (b) ႄভԧᮃ̡ԧᮃ2
对共振峰频率没有影响，元音音质基本无变化；随着
图 9 男性发音人两次所发音节 [ã] 的宽带语图
F 2 峰强的继续衰减，元音音质先是变得模糊不清， Fig. 9 Wide-band spectrogram of the syllable [tã]
最终变得与剩余F 1 相对应元音的音质相近(这与本 produced by male speaker twice

142 143 144 145 146 147 148 149 150 151 152