Page 50 - 《应用声学》2023年第2期
P. 50
238 2023 年 3 月
海豚哨声信号,使用改进的自适应子带谱熵的方法
0 引言
来对沃特金斯海洋哺乳动物声音数据库 [10] 中包含
海豚的哨声信号是一种频率随时间变化而变 的58个海豚哨声信号数据段进行检测,取得了较高
化的调频信号,频带相对较窄,信号持续时间从几 的检测率。分形理论中,分形维数 [11] 对端点检测有
百毫秒到几秒之间不等,主要用于海豚个体或群 较好的效果,因此分形维数在语声端点检测中得到
体之间的互相联络、情感表达、信息传递等 [1] 。海 了广泛的应用 [12−13] 。鉴于分形维数在语声和生物
豚的哨声信号被广泛用于物种描述、识别、密度估 医学工程领域的应用 [14−15] ,Lebien等 [16] 将分形维
计、仿生声呐设计以及仿生水下通信等。近年来用 数应用于鲸类的物种分类,说明分形维数可以用于
于收集海洋哺乳动物声信号被动声学监测 (Passive 描述鲸豚类声信号特点,受上述工作启发,将分形维
acoustic monitoring, PAM)技术得到越来越广泛的 数引入海豚哨声信号检测中。
应用。PAM 通过长期检测获取了大量的海洋哺乳 为了提高海豚哨声信号的检测正确率,提供准
动物的声信号,需要利用信号自身特性从这些记录 确的海豚哨声信号的端点分割,本文提出一种利用
中提取所需信号,因此如何自动检测海豚哨声信号 时域盒分形维数的海豚哨声信号检测方法。该方法
成为亟需解决的问题。 首先对待检测的声信号数据进行分帧,对分帧后的
在海豚哨声信号检测方面,Mellinger等 [2] 将时 数据计算盒分形维数,将计算得到的盒分形维数特
频图相关法用于检测哨声信号,将已知类型的信号 征值做模糊 C 均值聚类 (Fuzzy C-mean clustering,
组成信号库,利用信号库中信号与待检测信号做互 FCMC),根据聚类中心确定检测阈值,然后将每帧
相关,基于相关度阈值来实现信号检测,由于哨声信 的盒分形维数与检测阈值相对比,确定该帧是否为
号复杂多变,该方法受到样本库的限制,适应性不 哨声信号帧。将所提出的方法与自适应子带谱熵的
强。Gillespie [3] 为检测哨声信号,提出一种基于边缘 方法在青岛海昌极地馆录制的海豚声信号数据进
检测算法的方法,该方法先计算海豚声信号的时频 行检测实验对比,证明了所提出方法的优越性。
图,将时频图利用高斯核函数进行平滑,再利用边
缘检测算法获取哨声信号的时频轮廓,实现对哨声 1 基于分形维数的端点检测
信号的检测。Roch 等 [4] 以及 Johansson 等 [5] 利用
1.1 盒分形维数
贝叶斯滤波器来跟踪哨声信号的频率轮廓。孙馨喆
等 [6] 将采集到的信号进行分帧,计算每帧信号的时 分形由递归、迭代生成,可用于分析自然界中
频图,然后采用自适应局部阈值法提取哨声信号轮 复杂的物体,而分维对非光滑、非规则、破碎的分形
廓并合并连通域,根据连通域的位置检测海豚哨声 客体进行等量刻画。分形有 3 个性质:首先是标度
信号的起止点。此类方法需要对图像进行复杂的处 不变性。在分形上不论将其放大或缩小,它的形态、
理,适应能力不强。此外,深度神经网络也在哨声信 复杂程度、不规则性等各种特性不会发生变化。然
号检测中发挥了重要应用。Kirsebom 等 [7] 通过使 后是自相似性。分形客体在整体或局部的不同空间
用 ResNet 对北大西洋露脊鲸 (Eubalaena glacialis 尺度或时间尺度都是相似的。最后是分形维数。分
Borowski) 声信号进行二元分类,实现其上扫型哨 形维数是描述分形理论特征的重要参数,欧式几何
声信号的检测。Ibrahim 等 [8] 提出一种包含卷积神 中维数为整数,而在分形几何中通过测度将维数扩
经网络和堆叠自动编码器的多模型深度学习算法 展到分数维。
来检测北大西洋露脊鲸的上扫型哨声信号,与传统 海豚声音信号类似人的语声信号,波形介于 1
机器学习方法相比在检测率、误检率等方面表现出 维和 2维之间,可看作一维直线弯曲、延拓成的二维
一定的优越性。但此类以数据为驱动的深度学习方 曲线。分形维数作为欧几里得几何维数的扩展,任
法需要大量的标注数据,训练样本决定了网络模型 一平面上的曲线的维度可以由它描述。分形维数估
的效果。 计可以作为信号复杂度的度量 [16] ,由于噪声段与信
由于人类语声与海豚哨声信号的时频结构相 号段有着不同的不规则度,在信号段中因其自身的
似,Qiao等 [9] 引入人类语声端点检测的方法来检测 相似性会呈现出相对稳定的分维值,信号段与噪声