Page 16 - 《应用声学》2019年第6期
P. 16

918                                                                                 2019 年 11 月


                                                               有效降低了离格 DOA估计方法的运算量。同年,胡
             0 引言                                              顺仁等    [11]  提出了一种联合稀疏贝叶斯理论和子空

                                                               间方法的近场声源定位算法,用于解决近场信号源
                 双耳声源定位利用耳道入口或者耳道内的传
                                                               的 DOA 估计问题。由于头和躯干的阴影效应的影
             声器接收到的声信号来估计空间中声源的方位。它
                                                               响,双耳信号与阵列信号的声传播模型有所不同,因
             在虚拟声重放       [1] 、助听器  [2] 、智能音视频会议      [3]  等
                                                               此上述这些离格阵列 DOA 估计算法都不能直接用
             领域有着广泛的应用,研究双耳声源定位有着重要
                                                               于解决双耳声源定位中的离格问题。
             的科学意义和研究价值。
                                                                   为了解决双耳声源定位中的离格问题,本文
                 双 耳 声 源 定 位 算 法 中 最 常 用 的 两 种 双 耳
                                                               提出一种基于加权宽带稀疏贝叶斯学习的离格双
             特 征 分 别 为 双 耳 时 间 差 (Interaural time differ-
                                                               耳声源定位方法 (Off-grid binaural sound source
             ence, ITD) 和双耳声级差 (Interaural level differ-
             ence, ILD)。一般而言,ITD适用于中低频的声源定                     localization based on weighted wideband sparse
                                                               Bayesian learning, WWSBL-OGBSSL)。首先建立
             位,ILD 适用于高频的声源定位。在 Jeffress             [4]  提出
                                                               离格双耳信号的稀疏信号模型,将离格双耳声源定
             双耳 “巧合假说” 模型 (coincident theory) 之后,研
                                                               位问题转化为一个凸优化问题,然后基于双耳相干
             究者们提出了一系列双耳声源定位算法。常用的双
             耳声源定位算法有两类:一类是基于头相关传递函                            与扩散能量比 (Binaural coherent-to-diffuse power
             数 (Head-related transfer function, HRTF) 的双耳      ratio, BCDR) 特征对双耳信号的各个频点进行加
             声源定位方法       [5−6] ,另一类是基于机器学习的监督                 权以降低噪声和混响的影响,最后利用加权宽带
             式双耳声源定位方法          [7−8] 。基于HRTF的双耳声源             稀疏贝叶斯学习方法来估计离格声源的方位角。
             定位方法的一般做法是:提取观测双耳信号的双耳                            WWSBL-OGBSSL 算法通过离格稀疏信号模型将
             特征 (如 ITD、ILD 等) 和 HRTF 数据库中各个离散                  声源方位角和测量方位角之间的偏离值作为估计
             测量方位角对应的双耳特征,然后进行匹配定位。                            参数进行迭代运算,有效提高了离格声源的方位
             这类方法计算量小,适用范围广,然而在低信噪比或                           角估计准确率。仿真和实际实验结果表明,和现有
             强混响环境下其定位性能会严重下降。监督式双耳                            的基于 HRTF的双耳声源定位方法相比,WWSBL-
             声源定位方法通过机器学习方法训练声源方位角                             OGBSSL 算法在各种复杂的声学环境下都有着更
             与双耳特征之间的关系,通常有着较高的定位准确                            高的定位精度和更强的鲁棒性,特别是提高了离格
             率。这类算法需要预先构建训练数据库,训练过程                            情况下的双耳声源定位性能。
                                                                                                 H
                                                                                            T
             计算复杂度高,而且在训练条件与测试条件不匹配                                本文常用的符号如下: ¯ x、x 和 x 分别表示 x
             的情况下定位性能会严重下降。本文重点研究基于                            的共轭、转置和共轭转置;A              P ×Q  表示一个 P × Q
             HRTF的双耳声源定位方法。                                    的矩阵,0     P ×Q  表示 P × Q 的全零矩阵,I P 表示
                 在基于 HRTF 的双耳声源定位方法中,声源的                       一个 P × P 的单位矩阵,diag(x) 表示一个对角矩
             方位角估计结果往往被限定在 HRTF 数据库的离                          阵,其对角线的元素与向量 x 的元素相同;tr(A)
                                                                                   ij
             散测量点上。当声源真实方位角与 HRTF 数据库                          表示矩阵 A 的迹,(A) 表示矩阵 A 中的 (i, j) 元素
                                                                                     ∥ 分别表示A
             的测量方位角不一致时,算法的定位性能会显著                             值。∥A  P ×Q ∥ 1 和∥A P ×Q 2 2        P ×Q  的L1范
             下降,这就是双耳声源定位中的离格问题。HRTF                           数和L2范数;C表示复数集。
             数据库的测量方位角间隔一般比较大 (不小于 5 ),
                                                        ◦
             因此离格问题对基于 HRTF 的双耳声源定位算法                          1 信号模型
             的影响不可忽视。随着压缩感知技术的兴起,研究
             者们提出了一系列离格稀疏重建方法来解决阵列                             1.1  离格双耳信号的稀疏表示模型
             到达角 (Direction of arrival, DOA) 估计中的离格                假设 s (n) 为点声源,x l (n) 和 x r (n) 分别为左
             问题。2013 年,Yang 等     [9]  提出了稀疏贝叶斯学习              右耳传声器采集到的声信号。研究表明,声源到双
             (Sparse Bayesian learning, SBL) 方法来解决窄带           耳内传声器的房间传递函数与声源到传声器的距
             信号 DOA 估计中的离格问题。2017 年,高阳等                 [10]   离、声源的方位角和俯仰角密切相关                 [12] 。本文只考
             提出了基于酉变换的实数域稀疏贝叶斯学习方法,                            虑远场声源水平面方位角定位问题,此时双耳信号
   11   12   13   14   15   16   17   18   19   20   21