Page 31 - 《应用声学》2022年第1期
P. 31

第 41 卷 第 1 期           韩哲等: 分布式无线声传感网加权预测误差语声去混响方法                                           27

             3 仿真与分析                                           以及说话人位于位置 3、T 60 = 900 ms 两种情况。

                                                               使用已有语声进行 60 次测试。表 5 展示了仿真实
                 本节对DWPE进行仿真测试,并使用其输出进
                                                               验中单个节点在运行单节点 (SN-WPE)、集中式
             行主客观实验,验证了所提出的分布式算法对于集
                                                               (Cen-WPE) 与分布式 (DWPE) 算法处理 25 s 混响
             中式算法性能的收敛性。首先在 3.1 小节对仿真设
                                                               语声所需的平均时间,测试中保持节点算力一致,且
             置进行介绍;3.2小节将会在仿真环境中对比集中式
                                                               忽略数据传输时间。
             算法与分布式算法的性能和运算复杂度;3.3小节将
                                                                      5.0
             会在环境噪声较高时对比集中式算法与分布式算                                                                ឭភ̡
                                                                      4.5
             法的稳定性,3.4 小节将会进行主观性测听实验。本                                                            ͜ܦ٨
                                                                      4.0
             节内若不做特殊说明,为便于比较算法性能,均默认                                         ͯᎶ 2
                                                                      3.5                         ᓬག 3
             选择参考节点进行单节点算法测试。
                                                                      3.0
             3.1 仿真设置                                               y/m  2.5  ᓬག 2
                 如图 3 所示,共设置两种房间大小。图 3(a) 房                           2.0
             间尺寸为 5 m×5 m×3 m,对应两种混响时间,分                              1.5                     ͯᎶ 1
             别为 T 60 = 450 ms与 T 60 = 650 ms,共有 3 个节点,                1.0
             设置 2 个说话人位置,Position 1 模拟说话人在房                           0.5
                                                                                                  ᓬག 1
             间内的一般状况,Position 2 模拟说话人在角落的                               0
                                                                         0     1     2     3      4     5
             情况;图 3(b) 房间尺寸为 7.5 m×7.5 m×3 m,对应                                        x/m
             T 60 = 900 ms 与 T 60 = 1100 ms 两种较高的混响时                                (a) ੝ᫎ1ࡇࠪ
             间,共有 4 个节点,设置 2 个说话人位置,Position 3                         7                          ឭភ̡
                                                                               ᓬག 3               ͜ܦ٨
             模拟说话人在房间内的一般状况,Position 4 模拟
                                                                       6
             说话人距离所有节点距离相似的状况。每个节点是                                                               ᓬག 4
             一个具有 3 个传声器的均匀线阵,传声器之间距离                                  5
             为5 cm。以上设置可验证在房间大小、混响时间、节                                y/m  4             ͯᎶ 4
             点数量与说话人位置等参数发生变化时,所提出的
                                                                       3
             分布式算法的普适性。声源语声信号从 TIMIT 数                                                          ͯᎶ 3
                                                                       2
             据库中取得,抽取 30 名男性与 30 名女性,共计 60
                                                                            ᓬག 2
             人语声,每人 25 s。各传声器拾取到的信号为纯净                                 1
             语声与说话人位置到传声器的房间冲激响应函数                                     0                    ᓬག 1
                                                                         0   1   2   3   4   5    6   7
             (Room impulse response, RIR)卷积得到,RIR通过                                    x/m
             镜像法   [31]  计算获得。                                                      (b) ੝ᫎ2ࡇࠪ
                 每个传声器设置固定的 30 dB 的本底噪声,信                                   图 3  测试仿真房间设置
             号STFT长度为512,帧叠为50%,L g = 8,τ = 1。性                         Fig. 3 Room setup for evaluation
             能测试指标为客观语声质量评价 (Perceptual eval-
                                                                   图 4 展示了单节点 WPE 算法 (Single Node1-
             uation of speech quality, PESQ)  [32] 、短时客观可懂
                                                               WPE、Single Node2-WPE 与 Single Node3-WPE)、
             度 (Short-time objective intelligibility, STOI)  [33] 、
                                                               集中式 (Cen-WPE) 与分布式 (DWPE) 算法输出语
             语 声 混 响 调 制 能 量 比 (Speech-to-reverberation
                                                               声在 PESQ分数的提升幅度随时间变化的趋势。由
             modulation energy ratio, SRMR)  [34] 。运行算法
                                                               于收敛速度会受到空间相对位置影响,所以在图 4
             的计算机处理器为i7-8750H,内存为16 GB。
                                                               中对所有节点的单节点算法收敛性均进行了展示。
             3.2 分布式算法性能与收敛性                                   由表 5 耗时情况可知,分布式算法处理时间与单节
                 在算法的运算复杂度与收敛性测试中,选取两                          点算法相似并低于集中式算法,且 WASN 规模越
             种设置。分别为说话人位于位置 1、T 60 = 650 ms                    大,耗时降低幅度会越明显,这一结果与 2.2 小节中
   26   27   28   29   30   31   32   33   34   35   36