Page 11 - 《应该声学》2022年第2期
P. 11
第 41 卷 第 2 期 康坊等: 子带 t 分布的快速独立向量分析在语声盲源分离中的应用 179
3.4 不同环境下分离性能对比 征。在子带模型中,基于t分布的改进算法取得了整
本文对比了传统AuxIVA [7] 和Fast AuxIVA [11] 体最优的分离性能,也进一步说明 t 分布比传统超
算法,并将子带超高斯模型引入到 AuxIVA 和 Fast 高斯分布更符合语声信号的重尾特性。此外,对于
AuxIVA中,来进一步对比验证子带t分布模型的合 相距较近的声源,所有算法的分离性能均有所下降,
理性和有效性。在每种实验条件下,对30 组混合数 这是因为当声源位置较近时,不同声源与传声器之
据分离后的平均结果进行了对比。首先验证了上述 间的传递函数相似度更高,在估计各个声源的分离
算法在不同声源位置下的分离性能。各声源组合 滤波器时难度也越大。
为图1(a)E2A中的声源位置(10 ,90 )、(10 ,170 )、 为了进一步验证算法的分离性能,给出了不
◦
◦
◦
◦
(50 ,70 )、(50 ,130 )和(130 ,170 )。 同混响时间下各算法的 SIR 和 SDR 提升结果。除
◦
◦
◦
◦
◦
◦
图 5 给出了不同声源位置下,各算法的 SIR 和 JR2 声源位置布放为 60 和 120 ,其他混响时间下
◦
◦
SDR 结果。可以看出引入子带模型后,各算法均有 声源位置均选择50 和130 。从图6中可以看出,混
◦
◦
较明显的性能提升,说明子带模型更能表示声源内 响时间对分离性能影响明显,但混响超过 300 ms
相邻频点比相距较远频点有更高频间依赖性的特 的条件下,分离性能变化较小。其中一个原因是超过
AuxIVA Fast AuxIVA ߕࣜAuxIVA ߕࣜFast AuxIVA ஈᤉᄊFast AuxIVA
40 30
35
25
30
20
25
DSIR/dB 20 DSDR/dB 15
15
10
10
5
5
0 0
(10O,90O) (10O,170O) (50O,70O) (50O,130O) (130O,170O) (10O,90O) (10O,170O) (50O,70O) (50O,130O) (130O,170O)
(a) DSIRࠫඋ (b) DSDRࠫඋ
图 5 不同声源位置下的分离性能对比
Fig. 5 Comparison of different algorithms for different source locations
AuxIVA Fast AuxIVA ߕࣜAuxIVA ߕࣜFast AuxIVA ஈᤉᄊFast AuxIVA
25
20
20
15
DSIR/dB 10 DSDR/dB 10
15
5
5
0 0
300 ms 470 ms 600 ms 780 ms 1300 ms 300 ms 470 ms 600 ms 780 ms 1300 ms
(a) DSIRࠫඋ (b) DSDRࠫඋ
图 6 不同混响时间下的分离性能对比
Fig. 6 Comparison of different algorithms for different reverberation time