Page 77 - 201901
P. 77
第 38 卷 第 1 期 苗晓孔等: 采用骨导语音自适应的语句分割方法 73
1
ॆʷӑࣨए 0
-1
0 1 2 3 4 5 6 7
ನག/10 6
(a) ຉՌԥܦ᥋ឦᮃ
1
ॆʷӑࣨए 0
-1
0 1 2 3 4 5 6 7
ನག/10 6
(b) Ѭሏඡឦᮃ
1
ॆʷӑࣨए 0
-1
0 1 2 3 4 5 6 7
ನག/10 6
(c) Ѭሏᰤឦᮃ
1.0
0.8
0.6
0.4
ॆʷӑࣨए 0.2 0
-0.2
-0.4
-0.6
-0.8
-1.0
0 1 2 3 4 5 6 7
ನག/10 5
(d) ԩኄʷឦᮃ
图 4 本文所提算法实验效果图
Fig. 4 Experimental effect of the algorithm in this paper
3.2 对比实验效果 单特征时分割算法的分割效果,其误语句中间的间
为了进一步说明本文所提算法的优良性,本文 隙作为语句截止点,将一句话分割成多句,分割错
还与骨导情况下的传统单特征和混合特征的单门 误。图5(d)表示基于骨导语音的融合特征固定阈值
限分割算法以及气导情况下的融合特征单门限分 分割方法,可看出由于分割阈值固定,当语句内部
割算法进行了对比。针对含有嘈杂人声、音乐背景、 停顿或静音段较大时会造成分割错误,引起后半句
汽车鸣笛背景等多种噪声环境进行了测试。本次实 语句内容丢失。在实际实验中需要不断调整固定阈
验选取了同步录制时含有背景音乐的语音数据进 值,因为后续语句间隔的不确定性仍旧会造成 “一
行测试,效果如图5所示。 句多分” 的现象出现。图 5(e) 表示基于气导语音的
图5 展示了四种分割算法对同一段语音分割出 融合特征分割法,由于受到背景音乐的干扰,直接对
第一个语句的分割效果。图5(a)表示含有音乐背景 其分割,其分割准确率很低。如果采用去噪方法,不
噪声的气导语音和骨导语音时域波形图。图5(b)表 同的背景噪声所需去噪方法不同,分割算法的适应
示本文的分割方法,经检验其分割正确,同时可以看 性降低。由此可见本文的分割算法优于其他三种分
出语句中间存在的较长间隙,但本文所提方法依旧 割算法。同时对四种算法进行了分割效果统计,如
能够实现正确分割。图5(c)表示基于骨导语音选取 表2所示。