Page 59 - 《应用声学》2024年第1期
P. 59

第 43 卷 第 1 期   任露露等: 点云投影结合轻量化卷积神经网络实现三维成像声呐快速目标分类                                           55


                   1.0                                         算机硬件资源的要求较高。ResNet50 的参数量为
                                                               45.75 M,相比 VGGNet16减少一半以上,而本文使
                   0.8
                                                               用的 MobileNetV2 模型参数仅为 2.28 M,模型参数
                 юᆸဋ  0.6                                      量较小,能够有效应用到各种嵌入式设备中。
                                                               4.3  模型计算速度比较
                                               ງएڏ
                   0.4                         ूएڏ                 由公式(11)可知,当使用3×3大小的卷积核时,
                                               ᚸՌڏ
                                                               深度可分离卷积的计算量可以减小至标准卷积的
                   0.2
                     0     20    40     60    80    100        1/9,与计算量相对应的是模型的计算速度。为了进
                                  ᤖ̽൓஝
                            (a) ˀՏᣥКᄊѬዝюᆸဋ                     一步衡量本文使用模型在水下目标分类任务中的
                   1.2                                         计算速度,分别使用 VGGNet16、ResNet50 与本文
                                               ງएڏ             MobileNetV2网络对水下目标图像进行特征提取和
                                               ूएڏ
                   1.0
                                               ᚸՌڏ             分类,所使用的数据集及参数设置均与 4.2 节实验
                 ͉̽Ѧ஝ϙ  0.8                                    相同,3 种模型的计算速度如表 4 所示。其中,训练
                                                               时间是指模型在训练过程中对每张图像耗费的时
                   0.6
                                                               间,测试时间是指模型在测试过程中对每张图像进
                                                               行预测所需要的时间。
                   0.4
                     0     20    40     60    80    100                     表 4  不同模型计算速度
                                  ᤖ̽൓஝
                             (b) ˀՏᣥКᄊ͉̽Ѧ஝                        Table 4 Computational speed of different
                                                                  network models
                           图 12  训练过程曲线
                   Fig. 12 Change curve of training process
                                                                      模型          训练时间/ms        测试时间/ms
             4.2 轻量化性能比较                                           VGGNet16           17             27
                                                                    ResNet50          20             13
                 MobileNetV2 网络中的深度分离卷积模块相
                                                                  MobileNetV2         9              4
             比标准卷积具有轻量化的特点,为了验证本文
             所使用模型的轻量化优势,分别使用 VGGNet16、
                                                                   从训练时间来看,VGGNet16 训练每张图像所
             ResNet50 与本文 MobileNetV2 网络在水下目标数
                                                               需要的时间为 17 ms,ResNet50 则需要 20 ms,本
             据集上进行特征提取和分类实验。实验使用数据
                                                               文 MobileNetV2 模型只需要 9 ms 即可完成对每张
             集为铁框、渔网、绳子 3 种水下目标的混合通道图,
                                                               图像的训练,训练时间减少一半左右。从测试时间
             训练过程中的模型的参数设置均与4.1节实验相同,
                                                               来看,VGGNet16 对每张图像的预测时间最长,需
             将混合深度图数据集中的 398张图像作为训练集对
                                                               要 27 ms,ResNet50 预测每张图像需要 13 ms,而
             模型进行训练,剩余部分作为测试集进行测试。几
                                                               MobileNetV2 仅需要 4 ms 便可实现对图像的类别
             种不同模型的参数量如表3所示。
                                                               预测。不同模型的实验结果表明,VGGNet16 及
                          表 3   不同模型参数量                        ResNet50 网络在训练和测试时间上均大于本文所
              Table 3 Different network model parameters        用的模型。由此可见,本文所用模型计算时间较
                                                               短,对于实时性要求较高的水下目标分类任务更具
                        模型                  参数量/M
                                                               优势。
                     VGGNet16                121.58
                      ResNet50                45.75
                                                               4.4  不同模型分类准确率
                     MobileNetV2              2.28
                                                                   在充分考虑模型参数及计算量的基础上,使用
                 由表 3 中的数据能够看出,VGGNet16 网络的                    VGGNet16、ResNet50 与本文 MobileNetV2 网络对
             参数量高达 121.58 M,其参数量在 3 个模型当中                      水下目标图像进行特征提取和分类,通过分类准确
             最大,由此可见该模型的空间复杂度较高,对计                             率进一步衡量本文使用模型的分类性能。实验使用
   54   55   56   57   58   59   60   61   62   63   64