Page 146 - 《应用声学)》2023年第5期
P. 146
1038 2023 年 9 月
Adam算法的参数更新差值: 表 2 第一组实验数据
α Table 2 First set of experimental data
∆θ t = −√ M t . (9)
G t + ϵ
类别 细分船只 帧数
2 实验 渔船、拖网渔船、贻贝船、
类别 A 98/28/ /95/23/52
拖船、挖泥船
2.1 实验数据 类别 B 摩托艇、领航船、帆船 195/26/76
本文采用两组实验数据作为验证,分别为开源 类别 C 客运渡轮 703
数据集ShipsEar和课题组自行采集的实验数据。 类别 D 远洋班轮、滚装船 174/261
其中,第一组数据为 ShipsEar 数据集,该数据 类别 E 海洋环境噪声 225
集共包含 90 段声频记录,分为 5 个类别,数据是利
用自容式水听器对码头上往来的船只噪声信号进 2.2 参数设置
行记录,以采集不同船速下的噪声以及与进坞或离 模型是由Pytorch和Librosa编制的。网络模型
坞时的空化噪声。由于数据是在真实开放水域中采 在 5 s 长的片段上训练了 500 个历时。初始学习率
集的,部分信号中混杂了人说话声、自然背景噪声, 被设定为0.001。如果验证集的准确度在连续5个历
偶尔也会记录到海洋哺乳动物的声音。经初步处理 时中没有提高,则学习率呈指数衰减,如公式 (10)
后,消除了背景噪声干扰强烈和模糊不清的信号。 所示:
对数据进行预处理,去除空白信号,并将原始信号按
α = 0.95 迭代次数 · α . (10)
照 5 s 时长进行分帧和标注,共生成 1956 个标注样
本。详细信息如表 2 所示,第一列是声信号目标类 采用 Adam 优化器。随着网络中层数的增加,
别,第二列是每类对应的细分船只,第三列是每类目 分布会逐渐发生变化。缓慢收敛意味着整体分布接
标的帧数。 近非线性函数取值区间的上界和下界,导致梯度在
第二组数据为课题组自行采集的数据 (如图 7 反向传播过程中消失。所以引入归一化、L2 正则化
所示),该数据采集利用 4 组自容式水听器对航道 和激活函数,使输入值落入更敏感的区域。它可以
上过往的船只进行记录,并利用船舶自动识别系统 使梯度变大,学习收敛变快,加快收敛速度。相关参
(Automatic identification system, AIS)对来往的船 数设置如表3所示。
只进行标注,包括目标类别、距离、航向、航速等信
息。采集过程中变换了多个采集地点,实验共持续4 表 3 网络训练相关参数设置
天,每天平均采集时间7 h,采集区域水深10∼18 m, Table 3 Network training related param-
经过听声和记录比对,滤除记录缺失数据、空声数 eter settings
据、干扰数据等,共计43种目标(包括捕捞船、货船、
参数选择 参数设置
拖船、客船、集装箱船、快艇等),144组wav文件。为
信号时长 5 s
了更加贴近真实场景下的应用效果,将 144 段目标
数据划分为4个类别,分别为客轮(Passenger)、货船 采样率 8 kHz
(Cargo ship)、小渔船(Yacht)和其他(Others),并将 特征 80 维 Fbank
采集的整段数据随机选取放入训练集或者测试集, 帧长 50 ms
再按照5 s的固定时长对数据进行截取,这样可以保 帧移 20 ms
证数据的独立性。若采取先截取再随机采样的方式 数据增强 SpecAugment
划分数据,由于同一目标或相邻时间内的信号数据 学习率 0.00000001∼0.001
变化不大,会使得训练集和测试集中的数据具有较 迭代周期 50 Epoch
强的相似性。经划分后共获得 8530 组数据,其中训 损失函数 AAM-Softmax, Margin 0.5, Scale 20
练集5971组,测试集2529组。 Embedding 192