Page 27 - 《应用声学》2022年第1期
P. 27

第 41 卷 第 1 期           韩哲等: 分布式无线声传感网加权预测误差语声去混响方法                                           23


             考虑在高混响空间内单个声源的情况,通过调整                             其中,h m (k, l) 为声源到第 m 个传声器的 ATF,L h
             各节点内滤波器系数的更新流程,可在显著降低                             由混响时间、STFT 窗长及帧移决定,该模型对语
             节点传输信号通道数与节点内运算复杂度的同时,                            声逐频带运算,为了表达简洁,下文中将省略频
             实现与集中式算法相同的去混响性能。本文提出                             带索引 (k)。由式 (1) 模型,可证明混响信号可被表
             的分布式算法无需预先已知房间的声学传递函数                             示为多通道自回归 (Multi-channel autoregressive,
             (Acoustic transfer function, ATF)、声源信号统计          MCAR) 系统的输出,这是自适应去混响算法的
             特性等信息,延续了集中式WPE算法的优点。                             理论基础     [22−23] 。由 MCAR 系统可知,各通道信
                 本文将按如下结构展开。第1节中介绍WASNs                        号可被写成多通道线性预测 (Multi-channel linear
             中的信号模型。WPE 算法的简介以及 DWPE算法                         prediction, MCLP)的形式:
             的具体介绍将会在第2节中给出,包括WASNs中信                                          M L g −1
                                                                               ∑ ∑      H
             号的发送与接收、各节点 RLS 更新流程等。第 3 节                        x ref (n)=d(n)+        g (l)x m (n − τ − l), (2)
                                                                                        m
             通过仿真与主客观实验验证了 DWPE 算法对于集                                         m=1 l=0
                                                                       H
                                                               其中,[·] 表示共轭转置,[·]           代表从所有传声器
             中式算法性能的收敛性,并对比了分布式算法与集                                                      ref
                                                               中任意选取的参考信号;g m (l) 为声源到第 m 个传
             中式算法在扩散噪声场景下的稳定性。
                                                               声器的空间回归系数(Room regression coefficient),
             1 信号模型                                            在特定房间静态声源场景下不随时间改变,其长度
                                                                                   ∑ τ−1
                                                               L g 与L h 有关;d(n) =         h ref (l)s(n − l) 为直达
                 如图 1 所示,一个 WASN包含若干个任意分布                                             l=0
                                                               声与早期混响的和,表示目标信号;τ 为预测时延,
             节点,每个节点中含有不同数目的传声器,在全连接
                                                               它的存在可避免语声处理中的过白化                   [23] 。为了表
             模型中每个节点都可以与其余所有节点使用无线
                                                               达方便,式(2)可转化为矩阵形式:
             传输的方式交换信息,每个节点均具有属于自己的
                                                                                           H
                                                                           x ref (n) = d(n) + g q(n),     (3)
             处理器,可以处理本地与从其他节点接收的数据。
                                                                          [
                                                               其中,g = g 1 (0), · · · , g 1 (L g − 1), · · · , g M (0), · · · ,
                                                                         ] T    ML g ×1        [
                                                               g M (L g −1)  ∈ C      与q(n) = x 1 (n−τ), · · · ,
                       ᓬག1
                                            ᓬག3
                                                               x 1 (n−τ −L g +1), · · · , x M (n−τ), · · · , x M (n−τ −
                                                                      ]    ML g ×1
                                                               L g + 1) ∈ C       表示空间回归系数 g m (l) 与存
                                                               储延时信号 x m (n) 按照时间与传声器顺序构成的
                                       ឭភ̡
                                                               数据矢量。同时由上可得,在MCLP模型中,对传声
                                                               器拾取信号进行去混响的过程即为对空间回归系
                                 ᓬག2
                                                               数 g 自适应估计的过程,去混响后的输出的目标信
                      图 1  分布式无线声传感网络示例                        号估计为
                       Fig. 1 Example of an WASN                          ⌢
                                                                                           H
                                                                           d(n) = x ref (n) − g q(n),     (4)
                 本节中考虑一个由 M 个传声器组成的 J 个                              [ ]
                                                                      ⌢
                                                               其中, · 代表估计值,这是由于在 WPE 算法中 g
             节点的 WASN(M > J),每个节点中的传声器个
                                        ∑ J                    会随时间更新,式 (4) 中结果为直达声信号 d(n) 的
             数为 M j ,j ∈ {1, · · · , J},则     M j = M。设
                                           j=1                 估计值。
             s(k, n) 为纯净语声的短时傅里叶变换 (Short-time
                                                                   在 WASNs 中拾取到的信号可按照节点为单位
             Fourier transform, STFT) 域表示,n 表示帧索引,
                                                               被表示为
             k ∈ {1, · · · , K} 表示频带索引,共有 K 个频带,可
                                                                               [  T         T   ] T
                                                                        x(n) = ¯ x (n), · · · , ¯ x (n)  ,
             得第 m 个传声器拾取的带混响信号在时频域可被                                             1          J
                                                                               [                  ] T
             建模为                                                       ¯ x j (n) = x j1 (n), · · · , x jM j (n)  ,
                              L h −1                                   T
                               ∑                               其中,[·] 表示转置, ¯ x j (n) 代表第 j 个节点的全部
                   x m (k, n) =    h m (k, l)s(k, n − l),  (1)
                                                               M j 个传声器所拾取到的信号,x ji (n) 代表第 j 个节
                               l=0
   22   23   24   25   26   27   28   29   30   31   32