Page 152 - 《应用声学)》2023年第5期
P. 152

1044                                                                                 2023 年 9 月


             测技术,为研究海豚发声习性、海豚声音识别及生                            信号做离散傅里叶变换,对不同的频率范围设计不
             物保护奠定基础。                                          同权重,求得加权后的谱质心;设置短时能量阈值、

                                                               谱质心阈值、谱质心二阶偏移率;将短时能量和谱
             1 方法及原理
                                                               质心超过阈值的部分作为备选有效声段;再分别向
             1.1 流程设计                                          备选有效声段的两端比较谱质心二阶偏移率,谱质
                 首先对获取的海洋声音,按照一定长度存储;                          心二阶偏移率超过阈值的部分,添加至备选有效声
             再将每段声频按照海豚的发声特征选择合适的长                             段生成完整的有效声段;输出有效声段。具体流程
             度进行分帧,并计算出每一帧的短时能量;对每一帧                           图如图1所示。


                                         ᖍԩܦᮃηՂ
                                                                         Ѭࣝ
                                        ોʷࠀ᫂एѬҟ
                                                        ೝ฾ʾʷ˔஡͈
                                                                      ҫКద஍ܦ඀
                                           Ѭࣝ
                                                                  Քܬᤥద஍ܦ඀ːቫೝ฾៨
                                                                 ᠏ॷ̄᫽Ϡረဋ௧աᡔ᣿᫠ϙ
                               ᝠካᆁ௑ᑟҧnj៨᠏ॷ֗៨᠏ॷ̄᫽Ϡረဋ
                                                                                 ೝ฾ʾʷࣝ
                                       ᝺ᎶՊ˔Ԡ஝᫠ϙ                     ҫКܬᤥద஍ܦ඀
                                                                     ա    ௧
                                                    ೝ฾ʾʷࣝ
                                          नݽೝ฾                    ᆁ௑ᑟ᧚֗៨᠏ॷᡔ᣿᫠ϙ
                                                    图 1  端点检测流程图
                                             Fig. 1 Endpoint detection flow chart
             1.2 信号预处理                                         信号进行分帧加窗处理。由于不需要对声音进行时
                 由于数据集中声频长度不同,处理时长较长的                          移叠加还原,不需要考虑旁瓣泄漏的问题,因此选择
             声频需要大量计算并且输出的声谱图不便于观察                             使用方形窗,步长等于窗长的分析方法。加窗后做
             持续时间很短的 click信号,为了体现每一帧短时能                        短时傅里叶变换将受到不确定性原理的约束,无法
             量、谱质心的变化,将所有声信号切割为时长 1 s 的                        同时保证时间分辨率与频率分辨率达到最优,因此
             若干段,切割后不足1 s的样本舍弃。                                窗长应根据实际情况选择,加窗计算公式                   [19]  如下:
                                                                               
                                                                                1, 0 6 n 6 N − 1,
             1.3 提取声频信号特征                                                ω n =                            (1)
                                                                                0, others,
                 通过寻找持续时间、声频能量符合目标发声特
             点并且在频域上符合目标发声频率范围的声段,即                                      x n (m) = ω n x n+m ,            (2)
             可从声音文件中区分出目标声音。由于获取的声音                            其中,n 表示采样点序号,m 表示帧序号,ω n 表示分
             能量大小受声信号种类和距离影响,用能量变化表                            析窗,x n (m)表示第m帧内第n采样点的信号振幅。
             示发声具有不确定性,因此在分析时,更依赖于频域
                                                               1.3.2 时域分析
             特征,两者互相验证,这样可以减少突发高频噪声和
                                                                   时域分析是提取语声信号的时域特征,短时能
             目标声信号能量较弱对结果的影响。
                                                               量、短时过零率、短时自相关系数和短时平均幅度
             1.3.1 信号分帧                                        差等是最基本的时域分析参数。短时能量是度量声
                 海豚声信号的特点是持续时间短、频率高。如                          信号幅值变化的函数,对高电平非常敏感;短时过零
             果每次处理的声频时间过长,在时域内能量变化会                            率表示的是信号波穿过横轴的次数,可以表达发生
             被平滑,在频域内傅里叶变换反映出的是信号整体                            信号的频次,由于噪声以及其他生物的声音也会使
             的功率谱特征,会掩盖短暂发声的信息,因此需要对                           短时过零率增大,因此不适用于海洋环境中;短时平
   147   148   149   150   151   152   153   154   155   156   157