Page 11 - 《应用声学》2022年第6期
P. 11
第 41 卷 第 6 期 吴礼福等: 应对说话人位置突变的鲁棒语声去混响 857
了不同混响信噪比 (Reverberation signal-to-noise 置突变的去混响算法在高斯白噪声环境下依然有
ratio, RSNR) 下,去混响信号的平均 PESQ 得分和 很强的鲁棒性,在不同混响强度下的去混响效果相
平均 SRMR。可以看出,本文所提出的带有声源位 较于原算法都有较大提升。
ຉ־ηՂ ԝຉ־ηՂ ࣜదឭភ̡ͯᎶቊԫೝᄊԝຉ־ηՂ
2.2 2.2 2.2
2.0 2.0 2.0
1.8 1.8 1.8
PESQ 1.6 PESQ 1.6 PESQ 1.6
1.4 1.4 1.4
1.2 1.2 1.2
1.0 1.0 1.0
20 30 40 Inf 20 30 40 Inf 20 30 40 Inf
RSNR/dB RSNR/dB RSNR/dB
(a) T 60 =300 ms (b) T 60=500 ms (c) T 60=800 ms
图 6 不同噪声环境下的 PESQ 得分
Fig. 6 PESQ score in different noise environments
ຉ־ηՂ ԝຉ־ηՂ ࣜదឭភ̡ͯᎶቊԫೝᄊԝຉ־ηՂ
5.5 5.5 5.5
5.0 5.0 5.0
4.5 4.5 4.5
SRMR 4.0 SRMR 4.0 SRMR 4.0
3.5
3.5
3.5
3.0 3.0 3.0
2.5 2.5 2.5
2.0 2.0 2.0
20 30 40 Inf 20 30 40 Inf 20 30 40 Inf
RSNR/dB RSNR/dB RSNR/dB
(a) T 60=300 ms (b) T 60 =500 ms (c) T 60 =800 ms
图 7 不同噪声环境下的 SRMR 得分
Fig. 7 SRMR scores in different noise environments
3.3 实际环境录声仿真测试 实际环境录声的多通道房间脉冲响应数据库 [21] 与
为了更合理地评估所提算法的去混响性能,采 TIMIT 数据库的纯净语声信号进行卷积作为测试
集了真实房间记录的多组混响信号对算法进行验 信号。最终的实验结果是真实房间记录的混响信号
证,并测试了算法对不同声学比位置处 (改变声源 和MARDY 数据库样本的平均值。
距传声器阵列的距离d)拾声信号的去混响性能。如
随着声源与传声器之间距离的增加,传声器所
图 8 所示,采用 4 个间隔为 10 cm 的传声器阵列,在
采集语声信号的混响强度也会增加,语声质量也
一个混响时间约为 700 ms 的房间中采集混响信号,
随之下降。图 9 为声源距传声器阵列不同距离时的
传声器阵列和扬声器的高度都为 1 m,扬声器在 6 s
PESQ得分和SRMR,可以看出,对于说话人位置突
时从传声器阵列的左侧 45 改变到右侧 45 位置,
◦
◦
每次实验播放的 12 s 纯净语声信号均取自 TIMIT 变的语声信号,本文所提出的带有说话人位置突变
数据库。此外,为了增加实验的可验证性和丰富实 检测的去混响算法均有效地提高了混响语声信号
验样本,提高实验结果的可靠性,本实验还采用了 的质量。