Page 146 - 应用声学2019年第4期
P. 146

606                                                                                  2019 年 7 月


                                                               号间具有相同的稀疏支撑集但是非零系数不同,该
             0 引言
                                                               模型主要被应用于水声 MIMO 通信和阵列信号处
                 麦克风阵列目前被广泛应用于音/视频会议系                          理与定位两个方面。
             统、车载系统以及智能音箱等领域。麦克风阵列对                                在实际应用的场景比如多人会议中,麦克风
             声源方向上的语音进行增强,这就要求信号相对                             阵列设备往往需要不断重新定位或者定位多人说
             于麦克风阵列的位置是已知的,而基于麦克风阵列                            话方向,这类场景对于麦克风阵列如何定位多说
             的声源定位技术为此提供了支持。传统的麦克风                             话人方位提出了新的挑战。金光明等                   [10]  提出用 L
             阵列声源定位技术主要分为三大类:基于最大输出                            型麦克风阵列,对多声源的频域与到达角进行联
             功率的可控波束形成的定位算法                [1] 、时延估计定位         合估计实现多声源的定位挑战,该算法能够得到
             算法  [2]  和基于高分辨率谱估计的定位算法                [3] 。可    5% 以下误差的定位精度,但是对于频率相同的情
             控波束形成定位算法需要做全局搜索,计算量大,                            况仍需要进一步优化,同时该算法也难以适用于
             同时对语音信号和噪声信号的频谱特性依赖性较                             宽带语音信号。章宇栋等             [11]  在传统的 CS 算法的
             强。时延估计定位算法运算量较小,易于实现算法                            基础上,以阵列时延关系构造房间冲激响应 CS 矩
             的硬件实现      [4] 。但是该算法在受到噪声、混响、信                   阵,实现多声源的波达方向 (Direction of arrival,
             号采样率等方面的影响时,麦克风阵列各个阵元                             DOA) 稀疏恢复,该算法相对于传统 CS 算法具有
             获取精确的时延值难度增大,导致算法的定位性能                            更好的多声源定位性能。Carabias 等             [12]  针对多声
             降低。基于联合可控响应功率和相位变换 (Steered                       源定位的问题,将非负矩阵分解 (Non-negative ma-
             response power-phase transform, SRP-PHAT) [5]  声
                                                               trix factorization, NMF) 算法优化为复数非负矩阵
             源定位算法结合了可控响应功率和相位变换加权
                                                               分解 (Complex non-negative matrix factorization,
             的优点,相对于时延估计的定位算法有更好的性能,
                                                               CNMF) 算法,用于求解空间协方差模型 (Spatial
             然而在混响和噪声强的情况下,该算法可能会在错
                                                               covariance model, SCM),最高可实现达6个声源的
             误的空间位置上产生波束峰值,定位效果下降。基
                                                               同时定位,对于声源数目的变化具有很好的鲁棒性。
             于高分辨率谱估计的算法主要运用于窄带信号的
                                                               然而该方法的前提为多声源的信号需要高度相关
             处理,而对于语音这类宽带信号的处理会增大算法
                                                               的,这使得算法在实际应用中出现了一定的局限性。
             的运算复杂度,不适合应用于实时实现。
                                                                   对于压缩感知声源定位算法,多声源场景一定
                 压缩感知(Compressive sensing, CS)理论      [6]  可
                                                               程度上降低了声源方向向量的空间稀疏程度,因
             以通过低于奈奎斯特采样率的方式对数据采集并
                                                               而将导致多声源条件下压缩感知声源定位算法的
             精确重构。声源的空间稀疏性使得该理论在声源定
                                                               性能下降。针对这一问题,考虑到对声源方向向量
             位研究中得到了应用。赵小燕等                [7]  针对高混响低
                                                               在多个连续语音帧中具有的稀疏相关性,本文以
             信噪比的环境提出了基于压缩感知的定位算法,将
                                                               分布式压缩感知的 JSM2 模型为框架,将多声源定
             声源定位问题转化为稀疏信号的重构问题,利用正
                                                               位问题转化为稀疏信号的联合重构问题。以同步
             交匹配追踪 (Orthogonal matching pursuit, OMP)
             算法对信号进行重构。针对信号在传输过程中存                             正交匹配追踪 (Simultaneous orthogonal matching
             在多径的问题,Patel 等       [8]  利用信号的空间稀疏性,             pursuit, SOMP) 算法对信号进行联合稀疏重构,进
             提出一种基于均匀线性阵列的方位估计新技术,实                            而估计声源方位。在低信噪比的环境和不同声源强
             现多径环境下对宽带语音信号的方位估计,相比                             度的场景下,对比传统的时延累加定位(Delay-and-
             Roor-MUSIC 算法和 ESPRIT 算法都具有更好的                    sum, DS)算法、SRP-PHAT算法、压缩感知-正交匹
             鲁棒性。分布式压缩感知 (Distributed compressed               配追踪 (Compressed sensing-orthogonal matching
             sensing, DCS) [9]  针对多个观测信号的相关性,提出                pursuit, CS-OMP) 算法和本文提出的分布式压缩
             对多个信号进行联合重构,提升稀疏信号的重构                             感知 -同步正交匹配追踪 (Distributed compressed
             性能。Baron 等    [9]  提出了三种联合稀疏模型 (Joint             sensing-simultaneous orthogonal matching pursuit,
             sparsity model, JSM),其中 JSM2 模型提出各个信              DCS-SOMP)算法对多声源的定位能力。
   141   142   143   144   145   146   147   148   149   150   151