Page 20 - 《应用声学》2019年第6期
P. 20
922 2019 年 11 月
本文选取两种现有的基于 HRTF 的双耳声源 对离格声源的定位性能明显优于 OC 算法和 IMF
定位方法与 WWSBL-OGBSSL 算法作对比,分别 算法。这是因为 OC算法和 IMF 算法的方位角估计
为Finger等 [6] 提出的在线校准(Online calibration, 结果被限定在了离散测量方位角上,而 WWSBL-
OC) 算法和 Liu 等 [20] 提出的双耳匹配滤波器 (In- OGBSSL 算法通过迭代估计出离声源真实方位角
teraural matching filter, IMF) 定位算法。本文中 最近的测量方位角和二者之间的偏移量,估计结
声源方位角估计的均方根误差 (Root mean square 果可能为声源真实方位角附近的任意值。OC 算
error, RMSE) 定义如下: 法和 IMF 算法对在格声源的方位角估计误差为
v {0 , 10 , 20 , · · ·},对离格声源的方位角估计误差为
◦
◦
◦
u L
1 2
u ∑
ˆ
RMSE = t |θ l − θ l | , (29) {5 , 15 , 25 , · · ·},最小估计误差为5 ;而WWSBL-
◦
◦
◦
◦
L
l=1 OGBSSL 对在格声源和离格声源的方位角估计误
其中,L 为双耳信号数据段总数,θ l 为第 l 个数据段 差都可以为任意小的值,在理想情况下误差可以降
ˆ
的声源真实方位角,θ l 为对应的声源方位角估计 至 0 ,因此 WWSBL-OGBSSL 算法可以显著提高
◦
值。声源方位角的估计准确率(Accuracy, Acc)定义 离格条件下的双耳声源方位角估计性能。
如下:
9
◦ /L × 100%, (30) 8
Acc = L ˆ −θ l |610
|θ l
◦ 为方位角估计误差不大于 10 的 7
◦
其中,L ˆ −θ l |610
|θ l 6
数据段总数。 5 (on-grid) (off-grid)
3.1 自由场环境下的双耳声源定位实验 RMSE/(O) 4 OC OC
IMF
IMF
3 Proposed Proposed
本小节通过仿真实验测试 WWSBL-OGBSSL 2
算法在自由场环境下的方位角估计性能。在前半 1
水平面内,MIT HRTF 数据库包含 37 个方位角的 0 -80 -60 -40 -20 0 20 40 60 80
HRIRs,分别为 {−90 , −85 , · · · , 85 , 90 },方位角 வͯᝈ/(O)
◦
◦
◦
◦
间隔为 5 。为了仿真在格声源和离格声源的情况, 图 2 自由场环境下三种算法对在格声源和离格声
◦
˜
可假设θ = {−90 , −80 , · · · , 80 , 90 }为所有的测 源的方位角估计的 RMSE 曲线
◦
◦
◦
◦
量方位角,这些方位角对应的HRIRs数据用于生成 Fig. 2 The RMSE of azimuth estimation of the
在格双耳信号,其余 18 个方位角的 HRIRs 数据用 OC, the IMF, the WWSBL-OGBSSL methods for
the on-grid sound sources and the off-grid sound
于生成离格双耳信号。测量方位角共有 19 个,方位
sources
角间隔δ = 10 。在每个方位角下,随机选取TIMIT
◦
数据库的 400 句语音信号仿真生成 400 句自由场环 3.2 不同噪声环境下的双耳声源定位实验
境下的双耳信号。首先将每个双耳信号分成时长为 本实验主要测试了 WWSBL-OGBSSL 算法在
1 s 的数据段,并对每段双耳信号分帧,然后基于语 不同信噪比下的方位角估计性能。为了模拟噪声环
音端点检测(Voice activity detection, VAD)算法去 境,本实验在 3.1 节自由场环境下生成的双耳信号
除非语音帧数据。分别采用 OC 算法、IMF 算法和 中加入扩散场噪声,生成带噪双耳信号。本实验中
WWSBL-OGBSSL 算法对每段信号进行声源方位 在格双耳信号的声源方位角为−30 ,离格双耳信号
◦
角估计。每段信号中语音帧的总数即为 WWSBL- 的声源方位角为 25 ,其他实验条件与 3.1 节相同。
◦
OGBSSL 算法中 MMV 模型的快拍数。自由场环 扩散场噪声是由 MIT HRTF 数据库中 72 个水平面
境下的加权系数 W k (m) 恒为 1。图 2 给出了自由场 方位角的HRIRs卷积高斯白噪声后叠加生成的。带
环境下三种算法对在格声源和离格声源的方位角 噪双耳信号的信噪比 (Signal-to-noise ratio, SNR)
估计均方根误差 (RMSE) 曲线图,“on-grid” 和 “off- 设定为0 dB到30 dB,间隔为10 dB。本实验采用方
grid”分别表示在格声源和离格声源,“Proposed”表 位角估计准确率指标来衡量三种算法对在格声源
示WWSBL-OGBSSL算法。 和离格声源的方位角估计性能。图 3 给出了不同信
从图 2 中可以看出,WWSBL-OGBSSL 算法对 噪比下三种算法对在格声源和离格声源的方位角
在格声源的定位性能稍优于 OC 算法和 IMF 算法, 估计准确率。