Page 27 - 《应用声学》2022年第1期
P. 27
第 41 卷 第 1 期 韩哲等: 分布式无线声传感网加权预测误差语声去混响方法 23
考虑在高混响空间内单个声源的情况,通过调整 其中,h m (k, l) 为声源到第 m 个传声器的 ATF,L h
各节点内滤波器系数的更新流程,可在显著降低 由混响时间、STFT 窗长及帧移决定,该模型对语
节点传输信号通道数与节点内运算复杂度的同时, 声逐频带运算,为了表达简洁,下文中将省略频
实现与集中式算法相同的去混响性能。本文提出 带索引 (k)。由式 (1) 模型,可证明混响信号可被表
的分布式算法无需预先已知房间的声学传递函数 示为多通道自回归 (Multi-channel autoregressive,
(Acoustic transfer function, ATF)、声源信号统计 MCAR) 系统的输出,这是自适应去混响算法的
特性等信息,延续了集中式WPE算法的优点。 理论基础 [22−23] 。由 MCAR 系统可知,各通道信
本文将按如下结构展开。第1节中介绍WASNs 号可被写成多通道线性预测 (Multi-channel linear
中的信号模型。WPE 算法的简介以及 DWPE算法 prediction, MCLP)的形式:
的具体介绍将会在第2节中给出,包括WASNs中信 M L g −1
∑ ∑ H
号的发送与接收、各节点 RLS 更新流程等。第 3 节 x ref (n)=d(n)+ g (l)x m (n − τ − l), (2)
m
通过仿真与主客观实验验证了 DWPE 算法对于集 m=1 l=0
H
其中,[·] 表示共轭转置,[·] 代表从所有传声器
中式算法性能的收敛性,并对比了分布式算法与集 ref
中任意选取的参考信号;g m (l) 为声源到第 m 个传
中式算法在扩散噪声场景下的稳定性。
声器的空间回归系数(Room regression coefficient),
1 信号模型 在特定房间静态声源场景下不随时间改变,其长度
∑ τ−1
L g 与L h 有关;d(n) = h ref (l)s(n − l) 为直达
如图 1 所示,一个 WASN包含若干个任意分布 l=0
声与早期混响的和,表示目标信号;τ 为预测时延,
节点,每个节点中含有不同数目的传声器,在全连接
它的存在可避免语声处理中的过白化 [23] 。为了表
模型中每个节点都可以与其余所有节点使用无线
达方便,式(2)可转化为矩阵形式:
传输的方式交换信息,每个节点均具有属于自己的
H
x ref (n) = d(n) + g q(n), (3)
处理器,可以处理本地与从其他节点接收的数据。
[
其中,g = g 1 (0), · · · , g 1 (L g − 1), · · · , g M (0), · · · ,
] T ML g ×1 [
g M (L g −1) ∈ C 与q(n) = x 1 (n−τ), · · · ,
ᓬག1
ᓬག3
x 1 (n−τ −L g +1), · · · , x M (n−τ), · · · , x M (n−τ −
] ML g ×1
L g + 1) ∈ C 表示空间回归系数 g m (l) 与存
储延时信号 x m (n) 按照时间与传声器顺序构成的
ឭភ̡
数据矢量。同时由上可得,在MCLP模型中,对传声
器拾取信号进行去混响的过程即为对空间回归系
ᓬག2
数 g 自适应估计的过程,去混响后的输出的目标信
图 1 分布式无线声传感网络示例 号估计为
Fig. 1 Example of an WASN ⌢
H
d(n) = x ref (n) − g q(n), (4)
本节中考虑一个由 M 个传声器组成的 J 个 [ ]
⌢
其中, · 代表估计值,这是由于在 WPE 算法中 g
节点的 WASN(M > J),每个节点中的传声器个
∑ J 会随时间更新,式 (4) 中结果为直达声信号 d(n) 的
数为 M j ,j ∈ {1, · · · , J},则 M j = M。设
j=1 估计值。
s(k, n) 为纯净语声的短时傅里叶变换 (Short-time
在 WASNs 中拾取到的信号可按照节点为单位
Fourier transform, STFT) 域表示,n 表示帧索引,
被表示为
k ∈ {1, · · · , K} 表示频带索引,共有 K 个频带,可
[ T T ] T
x(n) = ¯ x (n), · · · , ¯ x (n) ,
得第 m 个传声器拾取的带混响信号在时频域可被 1 J
[ ] T
建模为 ¯ x j (n) = x j1 (n), · · · , x jM j (n) ,
L h −1 T
∑ 其中,[·] 表示转置, ¯ x j (n) 代表第 j 个节点的全部
x m (k, n) = h m (k, l)s(k, n − l), (1)
M j 个传声器所拾取到的信号,x ji (n) 代表第 j 个节
l=0