Page 16 - 《应用声学》2019年第6期
P. 16
918 2019 年 11 月
有效降低了离格 DOA估计方法的运算量。同年,胡
0 引言 顺仁等 [11] 提出了一种联合稀疏贝叶斯理论和子空
间方法的近场声源定位算法,用于解决近场信号源
双耳声源定位利用耳道入口或者耳道内的传
的 DOA 估计问题。由于头和躯干的阴影效应的影
声器接收到的声信号来估计空间中声源的方位。它
响,双耳信号与阵列信号的声传播模型有所不同,因
在虚拟声重放 [1] 、助听器 [2] 、智能音视频会议 [3] 等
此上述这些离格阵列 DOA 估计算法都不能直接用
领域有着广泛的应用,研究双耳声源定位有着重要
于解决双耳声源定位中的离格问题。
的科学意义和研究价值。
为了解决双耳声源定位中的离格问题,本文
双 耳 声 源 定 位 算 法 中 最 常 用 的 两 种 双 耳
提出一种基于加权宽带稀疏贝叶斯学习的离格双
特 征 分 别 为 双 耳 时 间 差 (Interaural time differ-
耳声源定位方法 (Off-grid binaural sound source
ence, ITD) 和双耳声级差 (Interaural level differ-
ence, ILD)。一般而言,ITD适用于中低频的声源定 localization based on weighted wideband sparse
Bayesian learning, WWSBL-OGBSSL)。首先建立
位,ILD 适用于高频的声源定位。在 Jeffress [4] 提出
离格双耳信号的稀疏信号模型,将离格双耳声源定
双耳 “巧合假说” 模型 (coincident theory) 之后,研
位问题转化为一个凸优化问题,然后基于双耳相干
究者们提出了一系列双耳声源定位算法。常用的双
耳声源定位算法有两类:一类是基于头相关传递函 与扩散能量比 (Binaural coherent-to-diffuse power
数 (Head-related transfer function, HRTF) 的双耳 ratio, BCDR) 特征对双耳信号的各个频点进行加
声源定位方法 [5−6] ,另一类是基于机器学习的监督 权以降低噪声和混响的影响,最后利用加权宽带
式双耳声源定位方法 [7−8] 。基于HRTF的双耳声源 稀疏贝叶斯学习方法来估计离格声源的方位角。
定位方法的一般做法是:提取观测双耳信号的双耳 WWSBL-OGBSSL 算法通过离格稀疏信号模型将
特征 (如 ITD、ILD 等) 和 HRTF 数据库中各个离散 声源方位角和测量方位角之间的偏离值作为估计
测量方位角对应的双耳特征,然后进行匹配定位。 参数进行迭代运算,有效提高了离格声源的方位
这类方法计算量小,适用范围广,然而在低信噪比或 角估计准确率。仿真和实际实验结果表明,和现有
强混响环境下其定位性能会严重下降。监督式双耳 的基于 HRTF的双耳声源定位方法相比,WWSBL-
声源定位方法通过机器学习方法训练声源方位角 OGBSSL 算法在各种复杂的声学环境下都有着更
与双耳特征之间的关系,通常有着较高的定位准确 高的定位精度和更强的鲁棒性,特别是提高了离格
率。这类算法需要预先构建训练数据库,训练过程 情况下的双耳声源定位性能。
H
T
计算复杂度高,而且在训练条件与测试条件不匹配 本文常用的符号如下: ¯ x、x 和 x 分别表示 x
的情况下定位性能会严重下降。本文重点研究基于 的共轭、转置和共轭转置;A P ×Q 表示一个 P × Q
HRTF的双耳声源定位方法。 的矩阵,0 P ×Q 表示 P × Q 的全零矩阵,I P 表示
在基于 HRTF 的双耳声源定位方法中,声源的 一个 P × P 的单位矩阵,diag(x) 表示一个对角矩
方位角估计结果往往被限定在 HRTF 数据库的离 阵,其对角线的元素与向量 x 的元素相同;tr(A)
ij
散测量点上。当声源真实方位角与 HRTF 数据库 表示矩阵 A 的迹,(A) 表示矩阵 A 中的 (i, j) 元素
∥ 分别表示A
的测量方位角不一致时,算法的定位性能会显著 值。∥A P ×Q ∥ 1 和∥A P ×Q 2 2 P ×Q 的L1范
下降,这就是双耳声源定位中的离格问题。HRTF 数和L2范数;C表示复数集。
数据库的测量方位角间隔一般比较大 (不小于 5 ),
◦
因此离格问题对基于 HRTF 的双耳声源定位算法 1 信号模型
的影响不可忽视。随着压缩感知技术的兴起,研究
者们提出了一系列离格稀疏重建方法来解决阵列 1.1 离格双耳信号的稀疏表示模型
到达角 (Direction of arrival, DOA) 估计中的离格 假设 s (n) 为点声源,x l (n) 和 x r (n) 分别为左
问题。2013 年,Yang 等 [9] 提出了稀疏贝叶斯学习 右耳传声器采集到的声信号。研究表明,声源到双
(Sparse Bayesian learning, SBL) 方法来解决窄带 耳内传声器的房间传递函数与声源到传声器的距
信号 DOA 估计中的离格问题。2017 年,高阳等 [10] 离、声源的方位角和俯仰角密切相关 [12] 。本文只考
提出了基于酉变换的实数域稀疏贝叶斯学习方法, 虑远场声源水平面方位角定位问题,此时双耳信号