Page 156 - 《应用声学)》2023年第5期
P. 156

1048                                                                                 2023 年 9 月


                                               表 2  不同阈值提取出的有效声段
                                Table 2 Effective segments extracted by different thresholds

                                                                     有效声段平均时长/s 包含噪声平均时长/s
                               短时能量的 55% 分界值、谱质心 2/3 位数                   0.027           0.013
                          短时能量的均值与 2/3 位数之和的均值、谱质心 2/3 位数                 0.07           0.0175
                       短时能量的 2/3 位数、谱质心 2/3 位数与谱质心 3/4 位数的均值              0.063           0.028


                 1.0                                           61025008、“whoi” 中的 61025004。为了避免提取出
                                                               的声段过短,设置最大静音长度为 5 帧,当有效声频
                 0.5
               ॆʷӑ૝ࣨ  0                                        之间间隔不超过 5 帧时,将其合并为一个声段。对
                                                               信号的提取如图 7 所示,图中每两条虚线表示一段
                -0.5
                                                               有效声频的起始点和终止点。检测结果如表3所示。
                -1.0
                                                                      1.0
                      0    0.2    0.4   0.6   0.8    1.0
                                                                      0.8
                                    ௑ᫎ/s                              0.5
                                                                   ॆʷӑ૝ࣨ  0
                        (a) ᆁ௑ᑟ᧚ᄊ55%Ѭႍϙnj៨᠏ॷ2/3ͯ஝                      0.2

                 1.0                                                -0.2
                                                                    -0.5
                                                                    -0.8
                 0.5                                                -1.0
               ॆʷӑ૝ࣨ  0                                                   0    0.2   0.4 ௑ᫎ/s 0.6  0.8  1.0


                -0.5                                                           (a) 25 dBη٪උဗܒʾclickηՂ
                -1.0                                                  1.0
                                                                      0.8
                      0    0.2    0.4   0.6    0.8   1.0
                                                                      0.5
                                    ௑ᫎ/s
                                                                   ॆʷӑ૝ࣨ  0
                    (b) ᆁ௑ᑟ᧚ᄊکϙˁ2/3ͯ஝˨֗ᄊکϙnj៨᠏ॷ2/3ͯ஝                   0.2
                 1.0                                                -0.2
                                                                    -0.5
                 0.5                                                -0.8
               ॆʷӑ૝ࣨ  0                                                   0  0.5  1.0  1.5 ௑ᫎ/s  2.5  3.0  3.5
                                                                                          2.0

                -0.5                                                          (b) -10 dBη٪උဗܒʾclickηՂ

                                                                      1.0
                -1.0
                      0    0.2    0.4   0.6    0.8   1.0              0.5
                                                                   ॆʷӑ૝ࣨ
                                    ௑ᫎ/s
                 (c) ᆁ௑ᑟ᧚ᄊ2/3ͯ஝nj៨᠏ॷ2/3ͯ஝ˁ៨᠏ॷ3/4ͯ஝ᄊکϙ                   0

                      图 6  不同阈值对检测结果的影响                             -0.5
               Fig. 6 Influence of different thresholds on detec-     -1.0
               tion results
                                                                          0    0.2   0.4   0.6    0.8   1.0
                                                                                       ௑ᫎ/s
                 (3) 为了测试端点检测的适应性,分别选择了                                       (c) -24 dBη٪උဗܒʾclickηՂ
             25 dB、−10 dB、−24 dB 信噪比的环境下的声音
                                                                         图 7  不同环境下端点检测的结果
             进行实验。实验数据通过 Audition 软件筛选,分别                         Fig. 7 Endpoint detection results in different en-
             为 “voice in the sea” 中的 6102500Q、“whoi” 中的           vironments
   151   152   153   154   155   156   157   158   159   160   161