Page 146 - 《应用声学)》2023年第5期
P. 146

1038                                                                                 2023 年 9 月


                 Adam算法的参数更新差值:                                              表 2  第一组实验数据
                                     α                              Table 2 First set of experimental data
                          ∆θ t = −√       M t .         (9)
                                    G t + ϵ
                                                                   类别          细分船只               帧数
             2 实验                                                         渔船、拖网渔船、贻贝船、
                                                                   类别 A                      98/28/ /95/23/52
                                                                              拖船、挖泥船
             2.1 实验数据                                              类别 B    摩托艇、领航船、帆船          195/26/76
                 本文采用两组实验数据作为验证,分别为开源                              类别 C        客运渡轮               703
             数据集ShipsEar和课题组自行采集的实验数据。                             类别 D     远洋班轮、滚装船            174/261
                 其中,第一组数据为 ShipsEar 数据集,该数据                        类别 E      海洋环境噪声               225
             集共包含 90 段声频记录,分为 5 个类别,数据是利
             用自容式水听器对码头上往来的船只噪声信号进                             2.2  参数设置
             行记录,以采集不同船速下的噪声以及与进坞或离                                模型是由Pytorch和Librosa编制的。网络模型
             坞时的空化噪声。由于数据是在真实开放水域中采                            在 5 s 长的片段上训练了 500 个历时。初始学习率
             集的,部分信号中混杂了人说话声、自然背景噪声,                           被设定为0.001。如果验证集的准确度在连续5个历
             偶尔也会记录到海洋哺乳动物的声音。经初步处理                            时中没有提高,则学习率呈指数衰减,如公式 (10)
             后,消除了背景噪声干扰强烈和模糊不清的信号。                            所示:
             对数据进行预处理,去除空白信号,并将原始信号按
                                                                             α = 0.95 迭代次数  · α  .    (10)
             照 5 s 时长进行分帧和标注,共生成 1956 个标注样
             本。详细信息如表 2 所示,第一列是声信号目标类                              采用 Adam 优化器。随着网络中层数的增加,
             别,第二列是每类对应的细分船只,第三列是每类目                           分布会逐渐发生变化。缓慢收敛意味着整体分布接
             标的帧数。                                             近非线性函数取值区间的上界和下界,导致梯度在
                 第二组数据为课题组自行采集的数据 (如图 7                        反向传播过程中消失。所以引入归一化、L2 正则化
             所示),该数据采集利用 4 组自容式水听器对航道                          和激活函数,使输入值落入更敏感的区域。它可以
             上过往的船只进行记录,并利用船舶自动识别系统                            使梯度变大,学习收敛变快,加快收敛速度。相关参

             (Automatic identification system, AIS)对来往的船        数设置如表3所示。
             只进行标注,包括目标类别、距离、航向、航速等信
             息。采集过程中变换了多个采集地点,实验共持续4                                      表 3  网络训练相关参数设置
             天,每天平均采集时间7 h,采集区域水深10∼18 m,                         Table 3 Network training related param-
             经过听声和记录比对,滤除记录缺失数据、空声数                               eter settings
             据、干扰数据等,共计43种目标(包括捕捞船、货船、
                                                                    参数选择                 参数设置
             拖船、客船、集装箱船、快艇等),144组wav文件。为
                                                                    信号时长                   5 s
             了更加贴近真实场景下的应用效果,将 144 段目标
             数据划分为4个类别,分别为客轮(Passenger)、货船                           采样率                  8 kHz
             (Cargo ship)、小渔船(Yacht)和其他(Others),并将                    特征                80 维 Fbank
             采集的整段数据随机选取放入训练集或者测试集,                                   帧长                  50 ms
             再按照5 s的固定时长对数据进行截取,这样可以保                                 帧移                  20 ms
             证数据的独立性。若采取先截取再随机采样的方式                                 数据增强               SpecAugment
             划分数据,由于同一目标或相邻时间内的信号数据                                  学习率             0.00000001∼0.001
             变化不大,会使得训练集和测试集中的数据具有较                                 迭代周期                 50 Epoch
             强的相似性。经划分后共获得 8530 组数据,其中训                             损失函数       AAM-Softmax, Margin 0.5, Scale 20
             练集5971组,测试集2529组。                                     Embedding               192
   141   142   143   144   145   146   147   148   149   150   151