Page 20 - 《应用声学》2019年第6期
P. 20

922                                                                                 2019 年 11 月


                 本文选取两种现有的基于 HRTF 的双耳声源                        对离格声源的定位性能明显优于 OC 算法和 IMF
             定位方法与 WWSBL-OGBSSL 算法作对比,分别                       算法。这是因为 OC算法和 IMF 算法的方位角估计
             为Finger等   [6]  提出的在线校准(Online calibration,       结果被限定在了离散测量方位角上,而 WWSBL-
             OC) 算法和 Liu 等    [20]  提出的双耳匹配滤波器 (In-            OGBSSL 算法通过迭代估计出离声源真实方位角
             teraural matching filter, IMF) 定位算法。本文中            最近的测量方位角和二者之间的偏移量,估计结
             声源方位角估计的均方根误差 (Root mean square                   果可能为声源真实方位角附近的任意值。OC 算
             error, RMSE) 定义如下:                                法和 IMF 算法对在格声源的方位角估计误差为
                                v                              {0 , 10 , 20 , · · ·},对离格声源的方位角估计误差为
                                                                         ◦
                                                                     ◦
                                                                 ◦
                                u    L
                                  1            2
                                u   ∑
                                        ˆ
                       RMSE =   t       |θ l − θ l | ,  (29)   {5 , 15 , 25 , · · ·},最小估计误差为5 ;而WWSBL-
                                                                         ◦
                                                                 ◦
                                                                     ◦
                                                                                                ◦
                                  L
                                    l=1                        OGBSSL 对在格声源和离格声源的方位角估计误
             其中,L 为双耳信号数据段总数,θ l 为第 l 个数据段                     差都可以为任意小的值,在理想情况下误差可以降
                                ˆ
             的声源真实方位角,θ l 为对应的声源方位角估计                          至 0 ,因此 WWSBL-OGBSSL 算法可以显著提高
                                                                  ◦
             值。声源方位角的估计准确率(Accuracy, Acc)定义                    离格条件下的双耳声源方位角估计性能。
             如下:
                                                                      9
                                      ◦ /L × 100%,     (30)           8
                      Acc = L ˆ −θ l |610
                              |θ l
                            ◦ 为方位角估计误差不大于 10 的                        7
                                                       ◦
             其中,L ˆ −θ l |610
                    |θ l                                              6
             数据段总数。                                                   5          (on-grid)  (off-grid)
             3.1 自由场环境下的双耳声源定位实验                                    RMSE/(O)  4   OC         OC
                                                                                             IMF
                                                                                  IMF
                                                                      3           Proposed   Proposed
                 本小节通过仿真实验测试 WWSBL-OGBSSL                             2
             算法在自由场环境下的方位角估计性能。在前半                                    1
             水平面内,MIT HRTF 数据库包含 37 个方位角的                             0  -80 -60 -40 -20 0  20  40  60  80
             HRIRs,分别为 {−90 , −85 , · · · , 85 , 90 },方位角                            வͯᝈ/(O)
                               ◦
                                             ◦
                                                 ◦
                                     ◦
             间隔为 5 。为了仿真在格声源和离格声源的情况,                             图 2  自由场环境下三种算法对在格声源和离格声
                    ◦
                   ˜
             可假设θ = {−90 , −80 , · · · , 80 , 90 }为所有的测           源的方位角估计的 RMSE 曲线
                                              ◦
                                          ◦
                            ◦
                                  ◦
             量方位角,这些方位角对应的HRIRs数据用于生成                             Fig. 2 The RMSE of azimuth estimation of the
             在格双耳信号,其余 18 个方位角的 HRIRs 数据用                         OC, the IMF, the WWSBL-OGBSSL methods for
                                                                  the on-grid sound sources and the off-grid sound
             于生成离格双耳信号。测量方位角共有 19 个,方位
                                                                  sources
             角间隔δ = 10 。在每个方位角下,随机选取TIMIT
                         ◦
             数据库的 400 句语音信号仿真生成 400 句自由场环                      3.2  不同噪声环境下的双耳声源定位实验
             境下的双耳信号。首先将每个双耳信号分成时长为                                本实验主要测试了 WWSBL-OGBSSL 算法在
             1 s 的数据段,并对每段双耳信号分帧,然后基于语                         不同信噪比下的方位角估计性能。为了模拟噪声环
             音端点检测(Voice activity detection, VAD)算法去           境,本实验在 3.1 节自由场环境下生成的双耳信号
             除非语音帧数据。分别采用 OC 算法、IMF 算法和                        中加入扩散场噪声,生成带噪双耳信号。本实验中
             WWSBL-OGBSSL 算法对每段信号进行声源方位                        在格双耳信号的声源方位角为−30 ,离格双耳信号
                                                                                              ◦
             角估计。每段信号中语音帧的总数即为 WWSBL-                          的声源方位角为 25 ,其他实验条件与 3.1 节相同。
                                                                                 ◦
             OGBSSL 算法中 MMV 模型的快拍数。自由场环                        扩散场噪声是由 MIT HRTF 数据库中 72 个水平面
             境下的加权系数 W k (m) 恒为 1。图 2 给出了自由场                   方位角的HRIRs卷积高斯白噪声后叠加生成的。带
             环境下三种算法对在格声源和离格声源的方位角                             噪双耳信号的信噪比 (Signal-to-noise ratio, SNR)
             估计均方根误差 (RMSE) 曲线图,“on-grid” 和 “off-               设定为0 dB到30 dB,间隔为10 dB。本实验采用方
             grid”分别表示在格声源和离格声源,“Proposed”表                    位角估计准确率指标来衡量三种算法对在格声源
             示WWSBL-OGBSSL算法。                                  和离格声源的方位角估计性能。图 3 给出了不同信
                 从图 2 中可以看出,WWSBL-OGBSSL 算法对                   噪比下三种算法对在格声源和离格声源的方位角
             在格声源的定位性能稍优于 OC 算法和 IMF 算法,                       估计准确率。
   15   16   17   18   19   20   21   22   23   24   25