Page 10 - 《应用声学》2022年第6期
P. 10

856                                                                                 2022 年 11 月


                               10
                             DMFCC   0



                             -10
                                0         2         4         6         8         10        12
                                                             ௑ᫎ/s
                                                  (a) ௄ឭភ̡ͯᎶቊԫೝ฾ᄊࣱک DMFCC
                               10
                             DMFCC   0




                             -10
                                 0         2         4         6        8         10        12
                                                             ௑ᫎ/s
                                                 (b) ࣜదឭភ̡ͯᎶቊԫೝ฾ᄊࣱک DMFCC

                                                    图 4  MFCC 距离改善
                                              Fig. 4 MFCC distance improvement

                              8
                             ᮠဋ/kHz  6 4 2



                              0
                               0          2         4         6         8         10        12
                                                             ௑ᫎ/s
                                                       (a) ຉ־ឦܦηՂឦ៨ڏ
                              8
                             ᮠဋ/kHz  6 4 2



                              0
                               0          2         4         6         8         10        12
                                                             ௑ᫎ/s
                                                     (b) Ԕካขԝຉ־ឦܦηՂឦ៨ڏ
                              8
                             ᮠဋ/kHz  6 4 2


                              0
                               0         2          4         6         8         10        12
                                                             ௑ᫎ/s
                                              (c) ࣜదឭភ̡ͯᎶቊԫೝ฾ᄊԝຉ־ឦܦηՂឦ៨ڏ
                                                    图 5  语声信号语谱图
                                              Fig. 5 Spectrogram of speech signal

                 图 5 显示了混响时间 T 60 = 500 ms 下的语声                3.2.3 高斯噪声环境下算法鲁棒性
             信号语谱图,从图 5(b) 中可以看到,6 s 时刻说话人
                                                                   该实验测试本文所提算法在加性高斯白噪声
             位置的突变严重影响了去混响算法的效果,导致
                                                               环境下的去混响性能。用PESQ得分和语声-混响调
             一段时间内的频谱结构变得比较模糊。而使用本
             文提出的带有说话人位置突变检测的去混响方法,                            制能量比 (Speech-to-reverberation modulation en-
             相较于图 5(b),图 5(c) 中的语谱图在 6∼7 s 这段时                 ergy ratio, SRMR)  [20]  作为评价指标。
             间内的模糊程度明显下降,模糊的频谱结构变得                                 通过在混响信号中加入不同程度大小的高斯
             更加清晰。                                             白噪声生成所需的测试信号,图 6 和图 7 分别显示
   5   6   7   8   9   10   11   12   13   14   15