Page 147 - 《应用声学》2021年第6期
P. 147
第 40 卷 第 6 期 赵擎华等: 共振峰编辑法区别鼻化元音中口、鼻音共振峰的实证探究 943
文对自然语音完全去除F 2 后前元音/a/的音质变为
3 分析与讨论
后元音/ /的结果一致)。
3.1 实验结果分析 为避免因共振峰强度衰减不足,未能使共振峰
频率发生根本性改变,或使共振峰相对强度的变化
通过共振峰编辑法得出的男性发音人口、鼻共
成为元音音质改变的主要原因,进而影响共振峰频
振峰分布状态与方强等 [17] 的研究结果基本一致。
率和调音器官动作特性对应关系的判断,所以本文
从语图 (图8) 中可以看出,F 1 以下大概 250 Hz附近
实验中将共振峰能量衰减至完全消除。因北京阳宸
会出现共振峰,同时 F 1 与 F 2 之间也有可能出现鼻
IV-12 计算机语音工作站 (V10.5) 每次最多只能衰
音共振峰。[ã] 的 F 1 与鼻音的 F n1 相距较远,相互
减 30 dB,故实验时连续衰减两次 (共 60 dB),以达
叠加的部分少,基本上对 250 Hz 附近的频谱没有
到完全去除共振峰的效果。
影响。鼻音共振峰 F n2 与口音共振峰 F 1 、F 2 都比
较靠近。不同的是,方强等认为第二鼻音峰很难 3.4 共振峰编辑法区分口鼻共振峰的价值
在频谱上表现出来,而男性发音人的第二鼻音峰 3.4.1 对司法话者识别领域的价值
清晰可见。 实验发现,不同人语音共振峰存在 “形似而质
与男性发音人口、鼻共振峰依次交替分布不同, 异” 的情况。两发音人所发相同鼻化元音的共振峰
女性发音人在F 1 以下大概250 Hz和600 Hz处存在 模式相似,在 2.5 kHz 以下均存在 4 个强峰,但共振
一弱一强两个鼻音共振峰。对于这种现象,Hawkins 峰 “身份” 属性却存明显相异 (如图 8 所示)。同样,
等 [16] 认为鼻腔的阻抗在大概 1.5 kHz 以下有多个 同一人语音共振峰也存在“形异而质似”的情况。同
低频共振,因此在鼻元音的声谱中有时可以观察到 一发音人多次所发相同鼻化元音共振峰的分布也
F 1 附近存在一个以上的鼻音共振峰。 可能不同。尤其是 F 1 和 F 2 之间鼻音峰的稳定性较
3.2 共振峰编辑法需去除低频鼻音干扰 差,存在明显的个体变异。如图 9 所示,男性发音
实验中发现,低频共振峰对元音听辨的影响较 C-ࠕࣜឦڏ[zjb-[ta].wav] <00:00:0.00036, 14.5 Hz>
大。尤其是在去除 F 1 附近的共振峰时,感知到语音 5.0
最大的变化特征是发闷、发嗡,而不是元音开口度 4.0
的变化。Kiefte 等 [25] 、Andrus [26] 认为通过降低共 ᮠဋ/kHz 3.0
振峰的振幅来改变元音音质时,低频共振峰同时掩 2.0
盖了高频共振峰,掩蔽效应和共振峰的频谱对比度 1.0
可能都在元音感知中起到一定的作用。为此,本文
实验中去除了低频鼻音共振峰以消除掩蔽效应。低 0 0.05 0.10 0.15 0.20 0.25
ᫎ
频鼻音峰与舌位的高低、前后并无明显相关性,去 (a) ႄভԧᮃ̡ԧᮃ1
除之后不仅不会影响元音舌位特征的感知,且会使 D-ࠕࣜឦڏ[zjb-[ta].wav] <00:00:0.00000, 14.5 Hz>
听辨过程更加容易,听辨结果也更加可靠。 5.0
3.3 共振峰编辑法需将能量衰减至完全消除 4.0
影响元音音质的因素不仅有共振峰频率,还有 ᮠဋ/kHz 3.0
共振峰的强度。Lindqvist 等 [27] 、Ainsworth 等 [28] 、 2.0
Aaltonen [29] 、Hedrick 等 [30] 通过语音合成实验发 1.0
现,随着共振峰相对强度的变化,合成元音的音质
0 0.05 0.10 0.15 0.20 0.25
也会同时发生改变。其中,Ainsworth 的实验表明, ᫎ
当 F 2 与 F 1 的能量差小于 28 dB 时,F 2 强度的降低 (b) ႄভԧᮃ̡ԧᮃ2
对共振峰频率没有影响,元音音质基本无变化;随着
图 9 男性发音人两次所发音节 [ã] 的宽带语图
F 2 峰强的继续衰减,元音音质先是变得模糊不清, Fig. 9 Wide-band spectrogram of the syllable [tã]
最终变得与剩余F 1 相对应元音的音质相近(这与本 produced by male speaker twice