Page 39 - 《应用声学》2021年第4期
P. 39
第 40 卷 第 4 期 刘峰等: 时频谱图和数据增强的水声信号深度学习目标识别方法 523
(1) 红 色 曲 线 表 示 3 层 的 CNN 网 络, 记 为 图 5 为本文方法识别结果的混淆矩阵 (Confu-
3_CNN; sion matrix),可用来呈现算法性能的可视化效果,
(2) 蓝色曲线为数据增强条件下的3层CNN网 每一列代表了预测类别,每一列的总数表示预测
络,记为3_CNN_Aug; 为该类别的数据的数目;每一行代表了数据的真实
(3) 黑色曲线为利用 ResNet 网络进行迁移学 归属类别,每一行的数据总数表示该类别的数据实
习的测试结果,该网络以 ImageNet 训练权重进行 例的数目。如第二行的 Moto boat,共有测试样本
初始化,通过添加全连接层进行目标分类,利用本文 68 个,正确分类结果为 54 个,误分类为 Passanger、
的数据集对后30层网络进行微调实现迁移学习,记 Ocean boat 和 Nature Noise 的个数分别为 2 个、11
为ResNet; 个和 1 个,通过混淆矩阵能够很快地分析每个类别
(4) 黄色曲线为采用改进的 VGG 网络进行的 的误分类情况。
测试,该网络共包括8个卷基层,记为8_VGGish;
(5) 绿色曲线为本文方法,采用数据增强和改 Little boat 63 0 0 0 0 150
进VGG网络的测试结果,记为8_VGGish_Aug。 Moto 0 54 2 11 1 120
从图4中分析可知,分别对比3_CNN、8_VGGish boat
方法和 3_CNN_Aug、8_VGGish_Aug 方法,在 1 0 64 5 0 90
相同的网络参数下,在一定范围内更深层的网 Passenger
络结构可以取得更好的分类性能,8_VGGish、 Ocean boat 0 0 0 170 0 60
8_VGGish_Aug 方法以 VGG 模型为基础,选取 30
8 层网络进行测试,取得了较好的效果。对比 Nature noise 0 1 0 2 115
ResNet 和 8_VGGish 方法,ResNet 方法为目前流 Little Moto Passenger Ocean Nature 0
行的 ResNet-50 网络,但是由于水声信号谱图中的 boat boat boat noise
纹理、梯度等特征不明显,细节信息较少,过深的 图 5 5 类目标分类的混淆矩阵
网络容易造成梯度消失,ResNet 网络的性能相比于 Fig. 5 Confusion matrices for five types of targets
VGGish 较差。最后分别对比 3_CNN、ResNet 和
3 结论
3_CNN_Aug、8_VGGish_Aug 方法,在相同网络
结构下,数据增强后的分类性能均有了一定的提高。 本文以典型的船舶类水下辐射噪声信号为研
综上所述,网络结构的改进和数据增强均有助于分 究对象,以水声信号的分类识别为目的,研究了深度
类性能的提高,本文所提的方法取得了最好的分类 学习方法在水声信号分类识别领域的应用能力。提
性能。表 3 列出了不同分类方法的对比,通过数据 取 Mel 功率谱图作为特征,构建基于 VGG 网络的
增强和网络模型的构建后,最终取得了 95.2% 的分 分类模型框架,验证了在数据增强条件下的分类性
类准确率。 能,最终的分类性能达到 95%。但是本文采用的试
验数据较少且训练集、测试集中的数据属于同一次
表 3 不同方法的分类准确率
试验采集,在实际情况下的水声信号种类更多,环境
Table 3 The classification accuracy of dif-
噪声也更复杂。因此,深度学习方法在更加复杂环
ferent methods
境下的识别应用还有待进一步进行研究。
方法 分类准确率/%
3_CNN 80.6 参 考 文 献
3_CNN_Aug 83.5
[1] Wang S, Zeng X. Robust underwater noise targets classifi-
ResNet 82.1
cation using auditory inspired time–frequency analysis[J].
8_VGGish 90.9 Applied Acoustics, 2014, 78: 68–76.
8_VGGish_Aug 95.2 [2] 程玉胜, 张宝华, 高鑫, 等. 船舶辐射噪声解调谱相位耦合特
性与应用 [J]. 声学学报, 2012, 37(1): 25–29.