Page 10 - 《应用声学》2020年第2期
P. 10

168                                                                                  2020 年 3 月


             ASR0009-OS1语音数据库中挑选包含男声、女声的
             25条干净中文语音作为测试语音,分别设定混响时
                                                                              参 考 文        献
             间为 0.38 s、0.5 s、0.8 s 和 3.8 s 四种情形,采用 3 种
             方法生成RIR再与干净语音卷积得到混响信号。实                             [1] Wu L, Qiu X, Burnett I, et al. Uncertainties of rever-
             验中选择 10 名听众,均为听力正常的在校研究生,                             beration time estimation via adaptively identified room
                                                                   impulse responses[J]. Journal of the Acoustical Society of
             对混响信号进行试听后,选出 3 种方法中最佳混响
                                                                   America, 2016, 139(1): 1093–1100.
             效果的信号。10名听众选出来的语音中,FDN方法                            [2] 吴礼福, 王华, 程义, 等. 一种基于最大似然的混响时间盲估
             处理的占 8%;ARMA 方法处理的语音占 39%;使用                          计方法 [J]. 应用声学, 2016, 35(4): 288–293.
                                                                   Wu Lifu, Wang Hua, Cheng Yi, et al. An improved al-
             ISM方法处理的语音占53%。实验结果表明ARMA                             gorithm for blind estimation of reverberation time based
             方法处理的混响效果明显优于 FDN 方法,与 ISM                            on maximum likelihood[J]. Journal of Applied Acoustics,
             方法接近。                                                 2016, 35(4): 288–293.
                                                                 [3] 齐园蕾, 杨飞然, 杨军. 基于卡尔曼滤波的低复杂度去混响算
                                                                   法 [J]. 应用声学, 2018, 37(4): 559–566.
                    3.0
                                                                   Qi Yuanlei, Yang Feiran, Yang Jun. Kalman filter based
                                                                   low-complexity dereverberation algorithm[J]. Journal of
                                                                   Applied Acoustics, 2018, 37(4): 559–566.
                    2.5
                                                                 [4] Patricka N, Gaubitch N. Speech dereverberation[M].
                  PESQ                                             Berlin: Springer, 2010: 5–10.
                    2.0                                          [5] Valimaki V, Parker J D, Savioja L, et al. Fifty years of
                                                                   artificial reverberation[J]. IEEE Transactions on Audio,
                                                                   Speech and Language Processing, 2012, 20(5): 1421–1448.
                                                                 [6] Rettinger M. Reverberation chambers for broadcasting
                    1.5
                          ISM       FDN       ARMA
                                                                   and recording studios[J]. Journal of Audio Engineering So-
                                                                   ciety, 1957, 5(1): 18–22.
              图 3  3 种方法处理的混响信号的 PESQ 均值及标准差
                                                                 [7] Bullen R. Simulation of room reverberation using a feed-
             Fig. 3 Mean and standard deviation of PESQ obtained   back delay network[J]. Journal of Acoustics Australia,
             by three different methods                             2015, 43(1): 1–4.
                                                                 [8] Savioja L, Huopaniemi J, Lokki T, et al. Creating in-
                 此外,在使用同一台计算机进行仿真计算时,                              teractive virtual acoustic environments[J]. Journal of the
                                                                   Audio Engineering Society, 1999, 47(5): 675–705.
             同样条件下统计了3种方法的运行时间,其中,FDN
                                                                 [9] Gardner W G. Efficient convolution without input-output
             运算时间为 1.06 s,ISM 运算时间为 3 s,而 ARMA                     delay[J]. Journal of the Audio Engineering Society, 1995,
             的运算时间为 0.8 s,表明 ARMA 方法在实时应用                          43(1): 127–136.
                                                                [10] Alien J B, Berkley D A. Image method for efficiently sim-
             方面比ISM方法具有明显优势。
                                                                   ulating small–room acoustics[J]. Journal of the Acoustical
                                                                   Society of America, 1979, 65(4): 943–950.
             3 结论                                               [11] Leglaive S, Badeau R, Richard G. Multichannel audio
                                                                   source separation with probabilistic reverberation pri-
                                                                   ors[J]. IEEE/ACM Transactions on Audio, Speech and
                 从易于实时应用的角度,本文研究了一种卷积                              Language Processing, 2016, 24(8): 2453–2465.
             法人工混响方法,其特点是在频域合成房间频率响                             [12] Kay S. Spectral estimation[M]//Advanced topics in signal
                                                                   processing. New Jersey: Prentice Hall, 1988: 58–122.
             应后再经傅里叶反变换得到时域房间脉冲响应,最
                                                                [13] Jeub M, Schafer M, Vary P. A binaural impulse re-
             后将干净无混响信号与时域房间脉冲响应卷积得                                 sponse database for evaluation of dereverberation algo-
             到混响信号。实验结果表明该方法既具有比反馈延                                rithms[C]. International Conference of Digital Signal Pro-
                                                                   cessing, 2009.
             迟网络方法更好的混响效果,同时又比镜像源法有
                                                                [14] Loizou P C. Speech enhancement: theory and practice[M].
             更少的计算量。                                               Florida: CRC Press, 2007: 492–495.
   5   6   7   8   9   10   11   12   13   14   15