Page 50 - 《应用声学》2023年第2期
P. 50

238                                                                                  2023 年 3 月


                                                               海豚哨声信号,使用改进的自适应子带谱熵的方法
             0 引言
                                                               来对沃特金斯海洋哺乳动物声音数据库                    [10]  中包含
                 海豚的哨声信号是一种频率随时间变化而变                           的58个海豚哨声信号数据段进行检测,取得了较高
             化的调频信号,频带相对较窄,信号持续时间从几                            的检测率。分形理论中,分形维数               [11]  对端点检测有
             百毫秒到几秒之间不等,主要用于海豚个体或群                             较好的效果,因此分形维数在语声端点检测中得到
             体之间的互相联络、情感表达、信息传递等                     [1] 。海    了广泛的应用       [12−13] 。鉴于分形维数在语声和生物
             豚的哨声信号被广泛用于物种描述、识别、密度估                            医学工程领域的应用          [14−15] ,Lebien等  [16]  将分形维
             计、仿生声呐设计以及仿生水下通信等。近年来用                            数应用于鲸类的物种分类,说明分形维数可以用于
             于收集海洋哺乳动物声信号被动声学监测 (Passive                       描述鲸豚类声信号特点,受上述工作启发,将分形维
             acoustic monitoring, PAM)技术得到越来越广泛的               数引入海豚哨声信号检测中。
             应用。PAM 通过长期检测获取了大量的海洋哺乳                               为了提高海豚哨声信号的检测正确率,提供准
             动物的声信号,需要利用信号自身特性从这些记录                            确的海豚哨声信号的端点分割,本文提出一种利用
             中提取所需信号,因此如何自动检测海豚哨声信号                            时域盒分形维数的海豚哨声信号检测方法。该方法
             成为亟需解决的问题。                                        首先对待检测的声信号数据进行分帧,对分帧后的
                 在海豚哨声信号检测方面,Mellinger等             [2]  将时    数据计算盒分形维数,将计算得到的盒分形维数特
             频图相关法用于检测哨声信号,将已知类型的信号                            征值做模糊 C 均值聚类 (Fuzzy C-mean clustering,
             组成信号库,利用信号库中信号与待检测信号做互                            FCMC),根据聚类中心确定检测阈值,然后将每帧
             相关,基于相关度阈值来实现信号检测,由于哨声信                           的盒分形维数与检测阈值相对比,确定该帧是否为
             号复杂多变,该方法受到样本库的限制,适应性不                            哨声信号帧。将所提出的方法与自适应子带谱熵的

             强。Gillespie [3]  为检测哨声信号,提出一种基于边缘                 方法在青岛海昌极地馆录制的海豚声信号数据进
             检测算法的方法,该方法先计算海豚声信号的时频                            行检测实验对比,证明了所提出方法的优越性。
             图,将时频图利用高斯核函数进行平滑,再利用边
             缘检测算法获取哨声信号的时频轮廓,实现对哨声                            1 基于分形维数的端点检测
             信号的检测。Roch 等        [4]  以及 Johansson 等  [5]  利用
                                                               1.1  盒分形维数
             贝叶斯滤波器来跟踪哨声信号的频率轮廓。孙馨喆
             等  [6]  将采集到的信号进行分帧,计算每帧信号的时                          分形由递归、迭代生成,可用于分析自然界中
             频图,然后采用自适应局部阈值法提取哨声信号轮                            复杂的物体,而分维对非光滑、非规则、破碎的分形
             廓并合并连通域,根据连通域的位置检测海豚哨声                            客体进行等量刻画。分形有 3 个性质:首先是标度
             信号的起止点。此类方法需要对图像进行复杂的处                            不变性。在分形上不论将其放大或缩小,它的形态、
             理,适应能力不强。此外,深度神经网络也在哨声信                           复杂程度、不规则性等各种特性不会发生变化。然
             号检测中发挥了重要应用。Kirsebom 等               [7]  通过使     后是自相似性。分形客体在整体或局部的不同空间
             用 ResNet 对北大西洋露脊鲸 (Eubalaena glacialis            尺度或时间尺度都是相似的。最后是分形维数。分
             Borowski) 声信号进行二元分类,实现其上扫型哨                       形维数是描述分形理论特征的重要参数,欧式几何
             声信号的检测。Ibrahim 等        [8]  提出一种包含卷积神            中维数为整数,而在分形几何中通过测度将维数扩
             经网络和堆叠自动编码器的多模型深度学习算法                             展到分数维。
             来检测北大西洋露脊鲸的上扫型哨声信号,与传统                                海豚声音信号类似人的语声信号,波形介于 1
             机器学习方法相比在检测率、误检率等方面表现出                            维和 2维之间,可看作一维直线弯曲、延拓成的二维
             一定的优越性。但此类以数据为驱动的深度学习方                            曲线。分形维数作为欧几里得几何维数的扩展,任
             法需要大量的标注数据,训练样本决定了网络模型                            一平面上的曲线的维度可以由它描述。分形维数估
             的效果。                                              计可以作为信号复杂度的度量               [16] ,由于噪声段与信
                 由于人类语声与海豚哨声信号的时频结构相                           号段有着不同的不规则度,在信号段中因其自身的
             似,Qiao等   [9]  引入人类语声端点检测的方法来检测                   相似性会呈现出相对稳定的分维值,信号段与噪声
   45   46   47   48   49   50   51   52   53   54   55