Page 152 - 《应用声学)》2023年第5期
P. 152
1044 2023 年 9 月
测技术,为研究海豚发声习性、海豚声音识别及生 信号做离散傅里叶变换,对不同的频率范围设计不
物保护奠定基础。 同权重,求得加权后的谱质心;设置短时能量阈值、
谱质心阈值、谱质心二阶偏移率;将短时能量和谱
1 方法及原理
质心超过阈值的部分作为备选有效声段;再分别向
1.1 流程设计 备选有效声段的两端比较谱质心二阶偏移率,谱质
首先对获取的海洋声音,按照一定长度存储; 心二阶偏移率超过阈值的部分,添加至备选有效声
再将每段声频按照海豚的发声特征选择合适的长 段生成完整的有效声段;输出有效声段。具体流程
度进行分帧,并计算出每一帧的短时能量;对每一帧 图如图1所示。
ᖍԩܦᮃηՂ
Ѭࣝ
ોʷࠀ᫂एѬҟ
ೝʾʷ˔͈
ҫКదܦ
Ѭࣝ
Քܬᤥదܦːቫೝ៨
᠏ॷ̄Ϡረဋ௧աᡔϙ
ᝠካᆁᑟҧnj៨᠏ॷ֗៨᠏ॷ̄Ϡረဋ
ೝʾʷࣝ
ᎶՊ˔Ԡϙ ҫКܬᤥదܦ
ա ௧
ೝʾʷࣝ
नݽೝ ᆁᑟ᧚֗៨᠏ॷᡔϙ
图 1 端点检测流程图
Fig. 1 Endpoint detection flow chart
1.2 信号预处理 信号进行分帧加窗处理。由于不需要对声音进行时
由于数据集中声频长度不同,处理时长较长的 移叠加还原,不需要考虑旁瓣泄漏的问题,因此选择
声频需要大量计算并且输出的声谱图不便于观察 使用方形窗,步长等于窗长的分析方法。加窗后做
持续时间很短的 click信号,为了体现每一帧短时能 短时傅里叶变换将受到不确定性原理的约束,无法
量、谱质心的变化,将所有声信号切割为时长 1 s 的 同时保证时间分辨率与频率分辨率达到最优,因此
若干段,切割后不足1 s的样本舍弃。 窗长应根据实际情况选择,加窗计算公式 [19] 如下:
1, 0 6 n 6 N − 1,
1.3 提取声频信号特征 ω n = (1)
0, others,
通过寻找持续时间、声频能量符合目标发声特
点并且在频域上符合目标发声频率范围的声段,即 x n (m) = ω n x n+m , (2)
可从声音文件中区分出目标声音。由于获取的声音 其中,n 表示采样点序号,m 表示帧序号,ω n 表示分
能量大小受声信号种类和距离影响,用能量变化表 析窗,x n (m)表示第m帧内第n采样点的信号振幅。
示发声具有不确定性,因此在分析时,更依赖于频域
1.3.2 时域分析
特征,两者互相验证,这样可以减少突发高频噪声和
时域分析是提取语声信号的时域特征,短时能
目标声信号能量较弱对结果的影响。
量、短时过零率、短时自相关系数和短时平均幅度
1.3.1 信号分帧 差等是最基本的时域分析参数。短时能量是度量声
海豚声信号的特点是持续时间短、频率高。如 信号幅值变化的函数,对高电平非常敏感;短时过零
果每次处理的声频时间过长,在时域内能量变化会 率表示的是信号波穿过横轴的次数,可以表达发生
被平滑,在频域内傅里叶变换反映出的是信号整体 信号的频次,由于噪声以及其他生物的声音也会使
的功率谱特征,会掩盖短暂发声的信息,因此需要对 短时过零率增大,因此不适用于海洋环境中;短时平