Page 64 - 201901
P. 64
60 2019 年 1 月
声源信号可以表示为 误差滤波器与房间脉冲响应逆滤波器的联合估计
P 方法,即 MSJE-IF-MSD(Maximum-skewness joint
∑
s(n) = b i (p)s (n − p) + e i (n), (2)
estimation based-inverse filtering for multichannel
p=1
speech dereverberation),简化为MSJE。
P
其中,{b i (p)} 为 P 阶预测系数,语声产生系统
p=1 g m 表示通道 m 的 L 阶自适应房间脉冲响应
P
的传递函数 B(z) 是 {b i (p)} 的 Z 变换,可以用一 T
p=1 逆滤波器系数,g m = [g m (0) , · · · , g m (L − 1)] ;
个阶数为 P 的时变 FIR 滤波器来表示,其逆滤波器 L−1
∑ −l
称为预测误差滤波器。房间声学系统的传递函数 G m = g m (l)z 为第 m 通道的房间脉冲响应逆
l=0
H(z) 可以用一个阶数为 L 的时不变 FIR 滤波来表 滤波器系统传递函数。这里需要假设每个通道的房
示。因此,观测信号 x(n) 是在 e(n) 激励下,经过语 间传递函数 G 1 (z) , · · · , G M (z) 之间没有共同的零
声产生系统B(z)和房间声学系统H(z)共同作用的 点。进而可以得到逆滤波后重构的语声信号:
输出结果。 M
∑ T
盲去混响的目标是在无任何房间先验知识的 y(n) = (g m ) x m (n), (3)
m=1
前提下,仅通过传声器观测信号 x(n) 去除由房间声
T
学系统 H(z) 所引起的混响,恢复声源信号s(n)。因 其中,x m (n) = [x m (n), · · · , x m (n − L + 1)] 。根
此,一个重要的问题就是在盲逆滤波过程中,如何 据语声信号的短时平稳性,将逆滤波输出 y(n) 分帧
P
将房间脉冲响应的逆滤波从整个系统的逆滤波中 后通过时变的预测误差滤波器 {a i (p)} p=1 ,得到第 i
分离出来,即去掉声道滤波对房间脉冲响应逆滤波 帧线性预测残差信号d i (n):
P
所造成的偏差。一种常用的方法是首先对混响语声 ∑
d i (n) = y i (n) − a i (p)y i (n − p). (4)
信号直接进行线性预测预白化处理,阶数一般取为
p=1
10,然后在线性预测残差域进行逆滤波。考虑线性
用向量形式表示:
预测系数受语声信号中混响的影响,直接对混响信
T
号进行线性预测求得的预测系数存在偏差,更为准 d i (n) = a y i (n), (5)
i
T
确的方法可以采用预测误差滤波器与房间脉冲响 其 中, a i = [1, −a i (1) , −a i (2) , · · · , −a i (P)] ,
T
应逆滤波器联合估计。图1 展示了联合估计算法的 y i (n) = [y i (n), y i (n − 1) , · · · , y i (n − P)] ,P 为预
P
实现框图,考虑时域实现收敛较慢,甚至可能不收 ∑
测误差滤波器阶数。A i (z) = 1 − a i (p)z −p 为预
敛,因此本文采用频域方法实现。首先用时不变的
p=1
房间脉冲响应逆滤波器在频域对观测信号进行滤 测误差滤波器系统传递函数。
波后,再通过时变的预测误差滤波器,得到线性预测 理想情况下最终得到的d i (n)与激励信号e i (n)
残差信号,以残差信号的偏度最大化为目标,计算 等价,只存在微小的延迟和幅度变化。因此,问题可
滤波器的更新梯度,进而更新房间脉冲响应逆滤波 退化为房间脉冲响应逆滤波器g 和预测误差滤波器
[
[
T
T
器,利用更新的逆滤波器对混响信号进行滤波,重构 a 的估计,g = g , · · · g T ] T ,a = a , · · · a T ] T ,S
1 M 1 S
出逆滤波后的语声信号。算法记为基于偏度的预测 为线性预测总帧数。
G ↼↽
x ↼n↽ FFT ⊲⊲⊲ IFFT
ए
G ↼L֓↽
y↼n↽ ıd i ↼n↽℘ S i֓
ıA i ↼z↽℘ S
i֓
...
G M↼↽ ए
x M↼n↽ FFT ⊲⊲⊲ IFFT
G M ↼L֓↽
图 1 MSJE 算法框图
Fig. 1 Schematic diagram of MSJE