Page 9 - 《应用声学》2020年第2期
P. 9

第 39 卷 第 2 期              吴礼福等: 频域合成房间频率响应的人工混响方法                                           167


                           1.0                                   1.0
                           0.8
                           0.6
                           0.4
                                                                 0.5
                           0.2
                        ࣨϙ  0                                 ࣨϙ
                          -0.2
                                                                  0
                          -0.4
                          -0.6
                          -0.8
                          -1.0                                 -0.5
                             0   500  1000  1500  2000  2500  3000  0  500  1000  1500  2000  2500  3000
                                           ᫽஝                                    ᫽஝
                                      (a) ᄾࠄ੝ᫎࠄ฾                               (b) ISMข
                           1.0                                   1.0
                           0.8                                   0.8
                           0.6
                                                                 0.6
                           0.4
                                                                 0.4
                           0.2                                   0.2
                        ࣨϙ  0                                 ࣨϙ
                          -0.2                                    0
                                                               -0.2
                          -0.4
                          -0.6                                 -0.4
                          -0.8                                 -0.6
                          -1.0                                 -0.8
                             0   500  1000  1500  2000  2500  3000  0  500  1000  1500  2000  2500  3000
                                           ᫽஝                                    ᫽஝
                                        (c) FDNข                             (d) ARMAข
                                               图 1  4 种方法获取的房间脉冲响应
                                  Fig. 1 Room impulse response obtained by four different methods
                 图2给出了图1中4个RIR的能量衰减曲线,从                        的结果接近,生成的 RIR 计算得到的混响时间与设
             中可以看出 ARMA 法的能量衰减曲线与 ISM 的非                       定值之间的误差也较小。
             常接近,两者与真实房间能量衰减曲线的距离明显                                除了从生成的 RIR 角度对比 3 种方法,本文还
             小于 FDN。另一方面,采用施罗德反向积分法计算                          采用人工混响处理后的语音信号来评价 3 种方法。
             得到 ISM、FDN 和 ARMA 法生成的 RIR 的混响时                   首先,从 TIMIT 数据库中         [1]  随机选取了 20 条语音
             间分别为 0.39 s、0.44 s 和 0.40 s,这与图 2 的能量             作为纯净无混响的信号 (式(1)中的x(t)),再将纯净
             衰减曲线体现的趋势一致,表明 FDN 方法生成的                          无混响信号分别与真实房间、3 种方法生成的各 20
             RIR 与真实房间的差异较大。ARMA 法和 ISM 法                      条 RIR 做卷积得到混响信号 (每种方法 400 条)。采

                                                               用语音质量感知评价           [14] (Perceptual evaluation of
                     0
                                                               speech quality, PESQ) 对混响效果进行评价,将真
                                               Real
                   -10                         ISM             实房间的混响信号作为 PESQ 的参考基准信号,其
                                               FDN
                   -20                         ARMA            他3 种方法的混响信号分别与参考基准信号计算得
                 ᑟ᧚ᛰѓ/dB  -30                                  到 PESQ 评分。图 3 为 3 种处理方法得到的混响信

                                                               号的 PESQ 平均得分及标准差,其中 ISM 平均得分
                   -40
                                                               为 2.77,标准差为 0.04;FDN 平均得分为 2.55,标准
                   -50
                                                               差为 0.02;ARMA 平均得分为 2.68,标准差为 0.02。
                   -60
                                                               图 3 表明 ARMA 法生成的混响信号比 FDN 法的更
                      0   0.05  0.10  0.15  0.20  0.25  0.30
                                    ௑ᫎ/s                       接近真实房间的混响信号。
                                                                   听者的主观感受是判断混响感的重要评价
               图 2  4 种方法获取的房间脉冲响应的能量衰减曲线
               Fig. 2  Energy decay curves of room impulse re-  标准,因此设计一组听音实验来判断 3 种方法中
               sponses obtained by four different methods       最接近真实房间产生的混响信号。在 AISHELL-
   4   5   6   7   8   9   10   11   12   13   14