Page 108 - 201806
P. 108
938 2018 年 11 月
观评估值 (Perceptual evaluation of speech quality, 可懂度评估的,满分为 1 分,STOI 值越高表明语音
PESQ) 和短时客观可懂度 [14] (Short-time objec- 可懂度越好。
tive intelligibility, STOI) 两个指标。PESQ 在 2001 表 1 为传统 K-SVD 语音增强算法和本文提出
年时被国际电信联盟 (ITU-T) 定为 P.862 标准,是 的改进 OMP 算法的语音增强算法在不同噪声类
评估试听者主观试听感觉的客观计算方法,最高分 型、不同信噪比下的PESQ与STOI的评估值。
是 4.5 分,计算得到的分值越高表明语音的质量就 在 car 噪声、信噪比为 10 dB 下的含噪语音及
越好。STOI 方法是对纯净语音与增强后语音进行 增强后的时域波形图和语谱图如图1所示。
0.10 0.10
0.08 0.08
0.06 0.06
0.04 0.04
0.02
0.02
ᮠဋ/Hz -0.02 0 ᮠဋ/Hz -0.02 0
-0.04 -0.04
-0.06 -0.06
-0.08 -0.08
-0.10 -0.10
0 0.5 1.0 1.5 2.0 2.5 0 0.5 1.0 1.5 2.0 2.5
4
4
ᫎ/10 s ᫎ/10 s
(a) ե٪ឦᮃ۫ฉॎڏ (b) ܙूឦᮃ۫ฉॎڏ
4.0 4.0
3.5 3.5
3.0 3.0
2.5
ᮠဋ/kHz 2.0 ᮠဋ/kHz 2.5
2.0
1.5 1.5
1.0 1.0
0.5 0.5
0 0
0.5 1.0 1.5 2.0 2.5 3.0 0.5 1.0 1.5 2.0 2.5 3.0
ᫎ/s ᫎ/s
(c) ե٪ឦᮃឦ៨ڏ (d) ܙूឦᮃឦ៨ڏ
图 1 时域波形图与语谱图
Fig. 1 Domain waveform and spectrogram
由表 1 与图 1 可以得出在各类噪声的不同信噪 100
͜ፒOMPካข
比条件下,本文提出的改进 OMP 算法的语音增强 80 ஈᤉOMPካข
算法的PESQ的值均高于传统K-SVD算法的值,表 60
明其语音质量更好。改进 OMP 算法的语音增强算 ᝫጷ᫂/s
法的 STOI 值与传统 K-SVD 语音增强算法的 STOI 40
值相比,基本保持不变,说明本文算法的并没有降低 20
语音的可懂度。
0
0 50 100 150 200 250 300 350
4.2 改进OMP算法运行时间对比 ٪ܦ᫂/s
图 2 为在字典维度、稀疏度和迭代次数都相同 图 2 随机噪声环境下两种算法所用时间对比
下,传统 OMP算法与改进OMP算法所用时间对比 Fig. 2 Time comparison of two algorithms in ran-
图。实验语音为随机噪声,图中横坐标代表所用噪 dom noise environment