Page 108 - 201806
P. 108

938                                                                                 2018 年 11 月


             观评估值 (Perceptual evaluation of speech quality,    可懂度评估的,满分为 1 分,STOI 值越高表明语音
             PESQ) 和短时客观可懂度           [14]  (Short-time objec-  可懂度越好。
             tive intelligibility, STOI) 两个指标。PESQ 在 2001          表 1 为传统 K-SVD 语音增强算法和本文提出
             年时被国际电信联盟 (ITU-T) 定为 P.862 标准,是                   的改进 OMP 算法的语音增强算法在不同噪声类
             评估试听者主观试听感觉的客观计算方法,最高分                            型、不同信噪比下的PESQ与STOI的评估值。
             是 4.5 分,计算得到的分值越高表明语音的质量就                             在 car 噪声、信噪比为 10 dB 下的含噪语音及
             越好。STOI 方法是对纯净语音与增强后语音进行                          增强后的时域波形图和语谱图如图1所示。

                         0.10                                    0.10
                         0.08                                    0.08
                         0.06                                    0.06
                         0.04                                    0.04
                                                                 0.02
                         0.02
                       ᮠဋ/Hz  -0.02 0                          ᮠဋ/Hz  -0.02 0
                        -0.04                                   -0.04
                        -0.06                                   -0.06
                        -0.08                                   -0.08
                        -0.10                                   -0.10
                            0    0.5   1.0   1.5   2.0   2.5        0    0.5   1.0   1.5   2.0    2.5
                                                                                     4
                                             4
                                        ௑ᫎ/10  s                                ௑ᫎ/10  s
                                    (a) ե٪ឦᮃ௑۫ฉॎڏ                           (b) ܙूឦᮃ௑۫ฉॎڏ
                          4.0                                     4.0
                          3.5                                     3.5
                          3.0                                     3.0
                          2.5
                        ᮠဋ/kHz  2.0                             ᮠဋ/kHz  2.5
                                                                  2.0
                          1.5                                     1.5
                          1.0                                     1.0
                          0.5                                     0.5
                           0                                       0
                                0.5  1.0  1.5  2.0  2.5  3.0            0.5  1.0  1.5  2.0  2.5  3.0
                                         ௑ᫎ/s                                    ௑ᫎ/s
                                     (c) ե٪ឦᮃឦ៨ڏ                             (d) ܙूឦᮃឦ៨ڏ
                                                  图 1  时域波形图与语谱图
                                           Fig. 1 Domain waveform and spectrogram


                 由表 1 与图 1 可以得出在各类噪声的不同信噪                           100
                                                                             ͜ፒOMPካข
             比条件下,本文提出的改进 OMP 算法的语音增强                                80      ஈᤉOMPካข
             算法的PESQ的值均高于传统K-SVD算法的值,表                               60
             明其语音质量更好。改进 OMP 算法的语音增强算                               ᝫጷ௑᫂/s
             法的 STOI 值与传统 K-SVD 语音增强算法的 STOI                         40
             值相比,基本保持不变,说明本文算法的并没有降低                                 20
             语音的可懂度。
                                                                      0
                                                                       0   50   100  150  200  250  300  350
             4.2 改进OMP算法运行时间对比                                                      ٪ܦ௑᫂/s
                 图 2 为在字典维度、稀疏度和迭代次数都相同                             图 2  随机噪声环境下两种算法所用时间对比
             下,传统 OMP算法与改进OMP算法所用时间对比                             Fig. 2 Time comparison of two algorithms in ran-
             图。实验语音为随机噪声,图中横坐标代表所用噪                               dom noise environment
   103   104   105   106   107   108   109   110   111   112   113