Page 10 - 《应用声学》2022年第6期
P. 10
856 2022 年 11 月
10
DMFCC 0
-10
0 2 4 6 8 10 12
ᫎ/s
(a) ឭភ̡ͯᎶቊԫೝᄊࣱک DMFCC
10
DMFCC 0
-10
0 2 4 6 8 10 12
ᫎ/s
(b) ࣜదឭភ̡ͯᎶቊԫೝᄊࣱک DMFCC
图 4 MFCC 距离改善
Fig. 4 MFCC distance improvement
8
ᮠဋ/kHz 6 4 2
0
0 2 4 6 8 10 12
ᫎ/s
(a) ຉ־ឦܦηՂឦ៨ڏ
8
ᮠဋ/kHz 6 4 2
0
0 2 4 6 8 10 12
ᫎ/s
(b) Ԕካขԝຉ־ឦܦηՂឦ៨ڏ
8
ᮠဋ/kHz 6 4 2
0
0 2 4 6 8 10 12
ᫎ/s
(c) ࣜదឭភ̡ͯᎶቊԫೝᄊԝຉ־ឦܦηՂឦ៨ڏ
图 5 语声信号语谱图
Fig. 5 Spectrogram of speech signal
图 5 显示了混响时间 T 60 = 500 ms 下的语声 3.2.3 高斯噪声环境下算法鲁棒性
信号语谱图,从图 5(b) 中可以看到,6 s 时刻说话人
该实验测试本文所提算法在加性高斯白噪声
位置的突变严重影响了去混响算法的效果,导致
环境下的去混响性能。用PESQ得分和语声-混响调
一段时间内的频谱结构变得比较模糊。而使用本
文提出的带有说话人位置突变检测的去混响方法, 制能量比 (Speech-to-reverberation modulation en-
相较于图 5(b),图 5(c) 中的语谱图在 6∼7 s 这段时 ergy ratio, SRMR) [20] 作为评价指标。
间内的模糊程度明显下降,模糊的频谱结构变得 通过在混响信号中加入不同程度大小的高斯
更加清晰。 白噪声生成所需的测试信号,图 6 和图 7 分别显示