Page 10 - 《应用声学》2020年第2期
P. 10
168 2020 年 3 月
ASR0009-OS1语音数据库中挑选包含男声、女声的
25条干净中文语音作为测试语音,分别设定混响时
参 考 文 献
间为 0.38 s、0.5 s、0.8 s 和 3.8 s 四种情形,采用 3 种
方法生成RIR再与干净语音卷积得到混响信号。实 [1] Wu L, Qiu X, Burnett I, et al. Uncertainties of rever-
验中选择 10 名听众,均为听力正常的在校研究生, beration time estimation via adaptively identified room
impulse responses[J]. Journal of the Acoustical Society of
对混响信号进行试听后,选出 3 种方法中最佳混响
America, 2016, 139(1): 1093–1100.
效果的信号。10名听众选出来的语音中,FDN方法 [2] 吴礼福, 王华, 程义, 等. 一种基于最大似然的混响时间盲估
处理的占 8%;ARMA 方法处理的语音占 39%;使用 计方法 [J]. 应用声学, 2016, 35(4): 288–293.
Wu Lifu, Wang Hua, Cheng Yi, et al. An improved al-
ISM方法处理的语音占53%。实验结果表明ARMA gorithm for blind estimation of reverberation time based
方法处理的混响效果明显优于 FDN 方法,与 ISM on maximum likelihood[J]. Journal of Applied Acoustics,
方法接近。 2016, 35(4): 288–293.
[3] 齐园蕾, 杨飞然, 杨军. 基于卡尔曼滤波的低复杂度去混响算
法 [J]. 应用声学, 2018, 37(4): 559–566.
3.0
Qi Yuanlei, Yang Feiran, Yang Jun. Kalman filter based
low-complexity dereverberation algorithm[J]. Journal of
Applied Acoustics, 2018, 37(4): 559–566.
2.5
[4] Patricka N, Gaubitch N. Speech dereverberation[M].
PESQ Berlin: Springer, 2010: 5–10.
2.0 [5] Valimaki V, Parker J D, Savioja L, et al. Fifty years of
artificial reverberation[J]. IEEE Transactions on Audio,
Speech and Language Processing, 2012, 20(5): 1421–1448.
[6] Rettinger M. Reverberation chambers for broadcasting
1.5
ISM FDN ARMA
and recording studios[J]. Journal of Audio Engineering So-
ciety, 1957, 5(1): 18–22.
图 3 3 种方法处理的混响信号的 PESQ 均值及标准差
[7] Bullen R. Simulation of room reverberation using a feed-
Fig. 3 Mean and standard deviation of PESQ obtained back delay network[J]. Journal of Acoustics Australia,
by three different methods 2015, 43(1): 1–4.
[8] Savioja L, Huopaniemi J, Lokki T, et al. Creating in-
此外,在使用同一台计算机进行仿真计算时, teractive virtual acoustic environments[J]. Journal of the
Audio Engineering Society, 1999, 47(5): 675–705.
同样条件下统计了3种方法的运行时间,其中,FDN
[9] Gardner W G. Efficient convolution without input-output
运算时间为 1.06 s,ISM 运算时间为 3 s,而 ARMA delay[J]. Journal of the Audio Engineering Society, 1995,
的运算时间为 0.8 s,表明 ARMA 方法在实时应用 43(1): 127–136.
[10] Alien J B, Berkley D A. Image method for efficiently sim-
方面比ISM方法具有明显优势。
ulating small–room acoustics[J]. Journal of the Acoustical
Society of America, 1979, 65(4): 943–950.
3 结论 [11] Leglaive S, Badeau R, Richard G. Multichannel audio
source separation with probabilistic reverberation pri-
ors[J]. IEEE/ACM Transactions on Audio, Speech and
从易于实时应用的角度,本文研究了一种卷积 Language Processing, 2016, 24(8): 2453–2465.
法人工混响方法,其特点是在频域合成房间频率响 [12] Kay S. Spectral estimation[M]//Advanced topics in signal
processing. New Jersey: Prentice Hall, 1988: 58–122.
应后再经傅里叶反变换得到时域房间脉冲响应,最
[13] Jeub M, Schafer M, Vary P. A binaural impulse re-
后将干净无混响信号与时域房间脉冲响应卷积得 sponse database for evaluation of dereverberation algo-
到混响信号。实验结果表明该方法既具有比反馈延 rithms[C]. International Conference of Digital Signal Pro-
cessing, 2009.
迟网络方法更好的混响效果,同时又比镜像源法有
[14] Loizou P C. Speech enhancement: theory and practice[M].
更少的计算量。 Florida: CRC Press, 2007: 492–495.