Page 146 - 应用声学2019年第4期
P. 146
606 2019 年 7 月
号间具有相同的稀疏支撑集但是非零系数不同,该
0 引言
模型主要被应用于水声 MIMO 通信和阵列信号处
麦克风阵列目前被广泛应用于音/视频会议系 理与定位两个方面。
统、车载系统以及智能音箱等领域。麦克风阵列对 在实际应用的场景比如多人会议中,麦克风
声源方向上的语音进行增强,这就要求信号相对 阵列设备往往需要不断重新定位或者定位多人说
于麦克风阵列的位置是已知的,而基于麦克风阵列 话方向,这类场景对于麦克风阵列如何定位多说
的声源定位技术为此提供了支持。传统的麦克风 话人方位提出了新的挑战。金光明等 [10] 提出用 L
阵列声源定位技术主要分为三大类:基于最大输出 型麦克风阵列,对多声源的频域与到达角进行联
功率的可控波束形成的定位算法 [1] 、时延估计定位 合估计实现多声源的定位挑战,该算法能够得到
算法 [2] 和基于高分辨率谱估计的定位算法 [3] 。可 5% 以下误差的定位精度,但是对于频率相同的情
控波束形成定位算法需要做全局搜索,计算量大, 况仍需要进一步优化,同时该算法也难以适用于
同时对语音信号和噪声信号的频谱特性依赖性较 宽带语音信号。章宇栋等 [11] 在传统的 CS 算法的
强。时延估计定位算法运算量较小,易于实现算法 基础上,以阵列时延关系构造房间冲激响应 CS 矩
的硬件实现 [4] 。但是该算法在受到噪声、混响、信 阵,实现多声源的波达方向 (Direction of arrival,
号采样率等方面的影响时,麦克风阵列各个阵元 DOA) 稀疏恢复,该算法相对于传统 CS 算法具有
获取精确的时延值难度增大,导致算法的定位性能 更好的多声源定位性能。Carabias 等 [12] 针对多声
降低。基于联合可控响应功率和相位变换 (Steered 源定位的问题,将非负矩阵分解 (Non-negative ma-
response power-phase transform, SRP-PHAT) [5] 声
trix factorization, NMF) 算法优化为复数非负矩阵
源定位算法结合了可控响应功率和相位变换加权
分解 (Complex non-negative matrix factorization,
的优点,相对于时延估计的定位算法有更好的性能,
CNMF) 算法,用于求解空间协方差模型 (Spatial
然而在混响和噪声强的情况下,该算法可能会在错
covariance model, SCM),最高可实现达6个声源的
误的空间位置上产生波束峰值,定位效果下降。基
同时定位,对于声源数目的变化具有很好的鲁棒性。
于高分辨率谱估计的算法主要运用于窄带信号的
然而该方法的前提为多声源的信号需要高度相关
处理,而对于语音这类宽带信号的处理会增大算法
的,这使得算法在实际应用中出现了一定的局限性。
的运算复杂度,不适合应用于实时实现。
对于压缩感知声源定位算法,多声源场景一定
压缩感知(Compressive sensing, CS)理论 [6] 可
程度上降低了声源方向向量的空间稀疏程度,因
以通过低于奈奎斯特采样率的方式对数据采集并
而将导致多声源条件下压缩感知声源定位算法的
精确重构。声源的空间稀疏性使得该理论在声源定
性能下降。针对这一问题,考虑到对声源方向向量
位研究中得到了应用。赵小燕等 [7] 针对高混响低
在多个连续语音帧中具有的稀疏相关性,本文以
信噪比的环境提出了基于压缩感知的定位算法,将
分布式压缩感知的 JSM2 模型为框架,将多声源定
声源定位问题转化为稀疏信号的重构问题,利用正
位问题转化为稀疏信号的联合重构问题。以同步
交匹配追踪 (Orthogonal matching pursuit, OMP)
算法对信号进行重构。针对信号在传输过程中存 正交匹配追踪 (Simultaneous orthogonal matching
在多径的问题,Patel 等 [8] 利用信号的空间稀疏性, pursuit, SOMP) 算法对信号进行联合稀疏重构,进
提出一种基于均匀线性阵列的方位估计新技术,实 而估计声源方位。在低信噪比的环境和不同声源强
现多径环境下对宽带语音信号的方位估计,相比 度的场景下,对比传统的时延累加定位(Delay-and-
Roor-MUSIC 算法和 ESPRIT 算法都具有更好的 sum, DS)算法、SRP-PHAT算法、压缩感知-正交匹
鲁棒性。分布式压缩感知 (Distributed compressed 配追踪 (Compressed sensing-orthogonal matching
sensing, DCS) [9] 针对多个观测信号的相关性,提出 pursuit, CS-OMP) 算法和本文提出的分布式压缩
对多个信号进行联合重构,提升稀疏信号的重构 感知 -同步正交匹配追踪 (Distributed compressed
性能。Baron 等 [9] 提出了三种联合稀疏模型 (Joint sensing-simultaneous orthogonal matching pursuit,
sparsity model, JSM),其中 JSM2 模型提出各个信 DCS-SOMP)算法对多声源的定位能力。