Page 156 - 《应用声学)》2023年第5期
P. 156
1048 2023 年 9 月
表 2 不同阈值提取出的有效声段
Table 2 Effective segments extracted by different thresholds
有效声段平均时长/s 包含噪声平均时长/s
短时能量的 55% 分界值、谱质心 2/3 位数 0.027 0.013
短时能量的均值与 2/3 位数之和的均值、谱质心 2/3 位数 0.07 0.0175
短时能量的 2/3 位数、谱质心 2/3 位数与谱质心 3/4 位数的均值 0.063 0.028
1.0 61025008、“whoi” 中的 61025004。为了避免提取出
的声段过短,设置最大静音长度为 5 帧,当有效声频
0.5
ॆʷӑࣨ 0 之间间隔不超过 5 帧时,将其合并为一个声段。对
信号的提取如图 7 所示,图中每两条虚线表示一段
-0.5
有效声频的起始点和终止点。检测结果如表3所示。
-1.0
1.0
0 0.2 0.4 0.6 0.8 1.0
0.8
ᫎ/s 0.5
ॆʷӑࣨ 0
(a) ᆁᑟ᧚ᄊ55%Ѭႍϙnj៨᠏ॷ2/3ͯ 0.2
1.0 -0.2
-0.5
-0.8
0.5 -1.0
ॆʷӑࣨ 0 0 0.2 0.4 ᫎ/s 0.6 0.8 1.0
-0.5 (a) 25 dBη٪උဗܒʾclickηՂ
-1.0 1.0
0.8
0 0.2 0.4 0.6 0.8 1.0
0.5
ᫎ/s
ॆʷӑࣨ 0
(b) ᆁᑟ᧚ᄊکϙˁ2/3ͯ˨֗ᄊکϙnj៨᠏ॷ2/3ͯ 0.2
1.0 -0.2
-0.5
0.5 -0.8
ॆʷӑࣨ 0 0 0.5 1.0 1.5 ᫎ/s 2.5 3.0 3.5
2.0
-0.5 (b) -10 dBη٪උဗܒʾclickηՂ
1.0
-1.0
0 0.2 0.4 0.6 0.8 1.0 0.5
ॆʷӑࣨ
ᫎ/s
(c) ᆁᑟ᧚ᄊ2/3ͯnj៨᠏ॷ2/3ͯˁ៨᠏ॷ3/4ͯᄊکϙ 0
图 6 不同阈值对检测结果的影响 -0.5
Fig. 6 Influence of different thresholds on detec- -1.0
tion results
0 0.2 0.4 0.6 0.8 1.0
ᫎ/s
(3) 为了测试端点检测的适应性,分别选择了 (c) -24 dBη٪උဗܒʾclickηՂ
25 dB、−10 dB、−24 dB 信噪比的环境下的声音
图 7 不同环境下端点检测的结果
进行实验。实验数据通过 Audition 软件筛选,分别 Fig. 7 Endpoint detection results in different en-
为 “voice in the sea” 中的 6102500Q、“whoi” 中的 vironments