Page 18 - 《应用声学》2019年第6期
P. 18

920                                                                                 2019 年 11 月

                                 ˜
                                                      ˜
                                          ˜
             ILD 和 ITD 分别为 L k (θ j ) 和 T k (θ j ),那么 a k (θ j ) 可  双耳声源定位问题,那么算法的性能在噪声或混响
             近似为                                               条件下会显著下降         [5−6] 。研究表明,利用双耳相干
                     [  L k ( ˜ θ j )  (  πkf s  ) ] T
                ˜
                                             ˜
             a k (θ j )≈ 10  20  exp −i   T k (θ j ) , 1  , (10)  与扩散能量比 (BCDR) 特征对各频点双耳特征进
                                      K
                                     √                         行加权处理可以明显提高噪声或混响条件下双耳
             其中,f s 为信号采样率,i =         −1为虚数单位。根据
                                                               声源定位算法的性能          [14−15] 。因此本文进一步提出
                                ˜
                                                ˜
                        ˜
             文献[5],L k (θ j )和T k (θ j )与测量方位角θ j 之间的关
                                                               利用 BCDR 特征对各个频点的双耳信号进行加权
             系可近似为以下参数模型:
                                                               以降低噪声和混响的影响。
                          ( )
                           ˜
                                       ˜
                       L k θ j ≈ ξ k sin θ j ,         (11)
                                                                   在一般声场中,双耳信号可以分为相干信号
                                            ˜
                                     ˜
                          ( )      d(θ j + sin θ j )           成分 x l|r,ss (n) 和扩散信号成分 x l|r,dd (n)。在 BSSL
                           ˜                           (12)
                       T k θ j ≈ ς k           ,
                                        2c                     中,声源角度是未知量,因此本文根据双耳信号
             其中,ξ k 和ς k 为与频率有关的参数,d为双耳内传声
                                                               x l|r (n) 的相干函数 Γ xx,k (m) 和扩散信号 x l|r,dd (n)
             器之间的距离,c 为空气中的声速。ξ k 和 ς k 可通过
                                                               的相干函数Γ dd,k (m)来估计BCDR。x l|r (n)的相干
             最小均方 (Least square, LS) 算法计算得出          [5] 。将
                                                               函数Γ xx,k (m)可以表示为
             式 (11) 和式 (12) 代入到式 (10) 中,并对其求导,可
                                                                                         ∗
                                                                             E {(X l,k (m)) (X r,k (m))}
             得                                                  Γ xx,k (m)= √           2            2  , (14)
                        [                                                    E{|X l,k (m)| }E{|X r,k (m)| }
                 ( )     ln 10
                                          ˜
                  ˜
                                   ˜
                                                                       ∗
              b k θ j =      ξ k cos θ j · Θ k (θ j )          其中,(·) 表示取共轭,E{·} 为期望函数。Lindevald
                          20                                     [16]
                                      ˜
                           dς k (1 + cos θ j )    ] T          等    的研究表明,远场条件下房间内 x l|r,dd (n) 的
                                              ˜
                        − i              · Θ k (θ j ), 0  , (13)  相干函数Γ dd,k (m)与帧数m无关,可以近似为
                                 2c
                             L k ( ˜ θ j )  (        )                Γ dd,k (m) ≡ Γ dd,k
                      ˜
                                                  ˜
             其中, Θ k (θ j ) = 10  20  exp −i  πkf s  T k (θ j ) 。
                                            K                                 1       sin(4.4πf k d/c)   (15)
             1.3 基于双耳相干与扩散能量比的加权方法                                  ≈ √  1 + (πf k d/c) 4  4.4πf k d/c  ,
                 与现有的基于 HRTF 的双耳声源定位算法类                        其中,f k = k · f s /2 (K − 1)。那么 BCDR 的无偏估
             似,若直接采用稀疏重构方法求解式 (9) 中的离格                         计公式为     [17]
              BCDR k (m) =
                                             √
                                                       {           }              (                  ) 2
                                          2          2            2            2
              Γ dd,k R {Γ xx,k (m)}−|Γ xx,k (m)| −  (Γ dd,k ) R |Γ xx,k (m)|  −|Γ xx,k (m)| + Γ dd,k −R{Γ xx,k (m)}
                                                                                                       , (16)
                                                             2
                                                    |Γ xx,k (m)| − 1
             其中,R {·}表示取实部。定义加权系数W k (m)为                      算法(WWSBL),用于解决式(18)的凸优化问题,从
                              {                                而实现离格声源方位角的估计。
                               1,  BCDR k (m) > 1,
                     W k (m) =                         (17)        在 MMV 模型下,经过特征加权后的离格双耳
                               0,  其他.
                                                               信号的稀疏表示模型为
                ˜
             令X k (m) = W k (m) · X k (m),那么经过特征加权的
                                                                    ˜ 2×M
                                                                    X     ≈ Φ 2×J  (β) Y  J×M  + V  2×M ,  (19)
             离格声源方位角估计问题可表示为                                          k       k        k       k
                                                                               [
                                                                                                 ]
                                                                                           ˜
                                                                      ˜ 2×M
                                                                                 ˜
                        K                                      其中,X         = X k (1), · · · , X k (M) ,Y  J×M  =
                        ∑ {
                        
 2                k                              k
                 arg min    
 ˜         2×J (β)Y k (m) 
       [                      ]    2×M     [
                             X k (m) − Φ
                                        k             2         Y k (1), Y k (2), · · · , Y k (M) ,V  = V k (1), · · · ,
                 Y k (m),β                                                                k
                        k=1                                          ]
                               
      
 }                      V k (M) ,M 为MMV模型中的快拍数。
                            + λ Y k (m) 
  .           (18)                {      } {       }   {      }

                                       1                                     ˜ 2×M      J×M        2×M   分别
                                                                   本文中, X          、 Y        和 V
                                                                                                   k
                                                                              k        k J×M     2×M
                                                                                ˜ 2×M
             2 基于加权宽带稀疏贝叶斯学习的离格双                               表示所有频点的 X         k   、Y k    和 V k    的集合。
                耳声源定位算法                                        假设双耳内的传声器接收到的环境噪声 v l|r (n) 为
                                                               高斯白噪声,则可进一步假设每帧信号各个频
                 在多测量矢量 (Multiple measurement vector,          率分量的噪声信号 V k (m) = [V l,k (m) , V r,k (m)]   T
             MMV) 模型下,本节推导加权宽带稀疏贝叶斯学习                          相 互 独 立 且 符 合 同 一 高 斯 分 布, 即 V k (m) ∼
   13   14   15   16   17   18   19   20   21   22   23