Page 18 - 《应用声学》2019年第6期
P. 18
920 2019 年 11 月
˜
˜
˜
ILD 和 ITD 分别为 L k (θ j ) 和 T k (θ j ),那么 a k (θ j ) 可 双耳声源定位问题,那么算法的性能在噪声或混响
近似为 条件下会显著下降 [5−6] 。研究表明,利用双耳相干
[ L k ( ˜ θ j ) ( πkf s ) ] T
˜
˜
a k (θ j )≈ 10 20 exp −i T k (θ j ) , 1 , (10) 与扩散能量比 (BCDR) 特征对各频点双耳特征进
K
√ 行加权处理可以明显提高噪声或混响条件下双耳
其中,f s 为信号采样率,i = −1为虚数单位。根据
声源定位算法的性能 [14−15] 。因此本文进一步提出
˜
˜
˜
文献[5],L k (θ j )和T k (θ j )与测量方位角θ j 之间的关
利用 BCDR 特征对各个频点的双耳信号进行加权
系可近似为以下参数模型:
以降低噪声和混响的影响。
( )
˜
˜
L k θ j ≈ ξ k sin θ j , (11)
在一般声场中,双耳信号可以分为相干信号
˜
˜
( ) d(θ j + sin θ j ) 成分 x l|r,ss (n) 和扩散信号成分 x l|r,dd (n)。在 BSSL
˜ (12)
T k θ j ≈ ς k ,
2c 中,声源角度是未知量,因此本文根据双耳信号
其中,ξ k 和ς k 为与频率有关的参数,d为双耳内传声
x l|r (n) 的相干函数 Γ xx,k (m) 和扩散信号 x l|r,dd (n)
器之间的距离,c 为空气中的声速。ξ k 和 ς k 可通过
的相干函数Γ dd,k (m)来估计BCDR。x l|r (n)的相干
最小均方 (Least square, LS) 算法计算得出 [5] 。将
函数Γ xx,k (m)可以表示为
式 (11) 和式 (12) 代入到式 (10) 中,并对其求导,可
∗
E {(X l,k (m)) (X r,k (m))}
得 Γ xx,k (m)= √ 2 2 , (14)
[ E{|X l,k (m)| }E{|X r,k (m)| }
( ) ln 10
˜
˜
˜
∗
b k θ j = ξ k cos θ j · Θ k (θ j ) 其中,(·) 表示取共轭,E{·} 为期望函数。Lindevald
20 [16]
˜
dς k (1 + cos θ j ) ] T 等 的研究表明,远场条件下房间内 x l|r,dd (n) 的
˜
− i · Θ k (θ j ), 0 , (13) 相干函数Γ dd,k (m)与帧数m无关,可以近似为
2c
L k ( ˜ θ j ) ( ) Γ dd,k (m) ≡ Γ dd,k
˜
˜
其中, Θ k (θ j ) = 10 20 exp −i πkf s T k (θ j ) 。
K 1 sin(4.4πf k d/c) (15)
1.3 基于双耳相干与扩散能量比的加权方法 ≈ √ 1 + (πf k d/c) 4 4.4πf k d/c ,
与现有的基于 HRTF 的双耳声源定位算法类 其中,f k = k · f s /2 (K − 1)。那么 BCDR 的无偏估
似,若直接采用稀疏重构方法求解式 (9) 中的离格 计公式为 [17]
BCDR k (m) =
√
{ } ( ) 2
2 2 2 2
Γ dd,k R {Γ xx,k (m)}−|Γ xx,k (m)| − (Γ dd,k ) R |Γ xx,k (m)| −|Γ xx,k (m)| + Γ dd,k −R{Γ xx,k (m)}
, (16)
2
|Γ xx,k (m)| − 1
其中,R {·}表示取实部。定义加权系数W k (m)为 算法(WWSBL),用于解决式(18)的凸优化问题,从
{ 而实现离格声源方位角的估计。
1, BCDR k (m) > 1,
W k (m) = (17) 在 MMV 模型下,经过特征加权后的离格双耳
0, 其他.
信号的稀疏表示模型为
˜
令X k (m) = W k (m) · X k (m),那么经过特征加权的
˜ 2×M
X ≈ Φ 2×J (β) Y J×M + V 2×M , (19)
离格声源方位角估计问题可表示为 k k k k
[
]
˜
˜ 2×M
˜
K 其中,X = X k (1), · · · , X k (M) ,Y J×M =
∑ {
2 k k
arg min
˜ 2×J (β)Y k (m)
[ ] 2×M [
X k (m) − Φ
k 2 Y k (1), Y k (2), · · · , Y k (M) ,V = V k (1), · · · ,
Y k (m),β k
k=1 ]
} V k (M) ,M 为MMV模型中的快拍数。
+ λ Y k (m)
. (18) { } { } { }
1 ˜ 2×M J×M 2×M 分别
本文中, X 、 Y 和 V
k
k k J×M 2×M
˜ 2×M
2 基于加权宽带稀疏贝叶斯学习的离格双 表示所有频点的 X k 、Y k 和 V k 的集合。
耳声源定位算法 假设双耳内的传声器接收到的环境噪声 v l|r (n) 为
高斯白噪声,则可进一步假设每帧信号各个频
在多测量矢量 (Multiple measurement vector, 率分量的噪声信号 V k (m) = [V l,k (m) , V r,k (m)] T
MMV) 模型下,本节推导加权宽带稀疏贝叶斯学习 相 互 独 立 且 符 合 同 一 高 斯 分 布, 即 V k (m) ∼