Page 156 - 《应用声学）》2023年第5期

P. 156

1048 2023 年 9 月

表 2 不同阈值提取出的有效声段
Table 2 Eﬀective segments extracted by diﬀerent thresholds

有效声段平均时长/s 包含噪声平均时长/s
短时能量的 55% 分界值、谱质心 2/3 位数 0.027 0.013
短时能量的均值与 2/3 位数之和的均值、谱质心 2/3 位数 0.07 0.0175
短时能量的 2/3 位数、谱质心 2/3 位数与谱质心 3/4 位数的均值 0.063 0.028

1.0 61025008、“whoi” 中的 61025004。为了避免提取出
的声段过短，设置最大静音长度为 5 帧，当有效声频
0.5
ॆʷӑ૝ࣨ 0 之间间隔不超过 5 帧时，将其合并为一个声段。对
信号的提取如图 7 所示，图中每两条虚线表示一段
-0.5
有效声频的起始点和终止点。检测结果如表3所示。
-1.0
1.0
0 0.2 0.4 0.6 0.8 1.0
0.8
௑ᫎ/s 0.5
ॆʷӑ૝ࣨ 0
(a) ᆁ௑ᑟ᧚ᄊ55%Ѭႍϙǌ៨᠏ॷ2/3ͯ஝ 0.2

1.0 -0.2
-0.5
-0.8
0.5 -1.0
ॆʷӑ૝ࣨ 0 0 0.2 0.4 ௑ᫎ/s 0.6 0.8 1.0

-0.5 (a) 25 dBη٪උဗܒʾclickηՂ
-1.0 1.0
0.8
0 0.2 0.4 0.6 0.8 1.0
0.5
௑ᫎ/s
ॆʷӑ૝ࣨ 0
(b) ᆁ௑ᑟ᧚ᄊکϙˁ2/3ͯ஝˨֗ᄊکϙǌ៨᠏ॷ2/3ͯ஝ 0.2
1.0 -0.2
-0.5
0.5 -0.8
ॆʷӑ૝ࣨ 0 0 0.5 1.0 1.5 ௑ᫎ/s 2.5 3.0 3.5
2.0

-0.5 (b) -10 dBη٪උဗܒʾclickηՂ

1.0
-1.0
0 0.2 0.4 0.6 0.8 1.0 0.5
ॆʷӑ૝ࣨ
௑ᫎ/s
(c) ᆁ௑ᑟ᧚ᄊ2/3ͯ஝ǌ៨᠏ॷ2/3ͯ஝ˁ៨᠏ॷ3/4ͯ஝ᄊکϙ 0

图 6 不同阈值对检测结果的影响 -0.5
Fig. 6 Inﬂuence of diﬀerent thresholds on detec- -1.0
tion results
0 0.2 0.4 0.6 0.8 1.0
௑ᫎ/s
(3) 为了测试端点检测的适应性，分别选择了 (c) -24 dBη٪උဗܒʾclickηՂ
25 dB、−10 dB、−24 dB 信噪比的环境下的声音
图 7 不同环境下端点检测的结果
进行实验。实验数据通过 Audition 软件筛选，分别 Fig. 7 Endpoint detection results in diﬀerent en-
为 “voice in the sea” 中的 6102500Q、“whoi” 中的 vironments

151 152 153 154 155 156 157 158 159 160 161