Page 58 - 《应用声学》2024年第1期
P. 58

54                                                                                   2024 年 1 月


             3.4 模型复杂度评估                                       络模型作为特征提取部分对网络进行训练,对比
                 网络模型的复杂度通常使用参数量和计算量                           不同输入下模型的训练、测试结果,验证混合通
             进行评估,卷积层和全连接层的参数量和计算量可                            道图对水下目标的分类效果。实验使用的所有
             以表示为                                              网络均基于 Keras 深度学习框架基础,实验计算
                                                              机采用 CPU 为 6 核 i7-10750H、Windows 操作系统、
                           D 1
                           ∑
                               2
                  
                   P cnn =   K · C l−1 · C l ,
                               l                              GPU为RTX2070。
                  
                           l=1                         (12)
                           D 1                                 4.1  不同 输 入 数 据 下 MobileNetV2 模型 分 类
                          ∑
                               2    2
                  F cnn =    M · K · C l−1 · C l ,
                  
                               l   l                               准确率
                           l=1
                                                                   使用上述数据集,分别将水下目标的深度伪彩
                                    D 2
                                   ∑
                   P dense = F dense =  C l−1 · C l ,  (13)    图、强度伪彩图及深度强度混合通道图作为网络
                                    l=1
                                                               的输入部分,利用 MobileNetV2 模型对水下目标进
                                                               行分类。根据网络和数据集设置的学习率大小为
             其中,P 和 F 分别代表模型的参数量和计算量,M l
             和K l 分别表示输入图片的尺寸和卷积核大小,C l−1
                                                               0.00005,迭代次数设置为 100,训练批次 batchsize
             和C l 为输入特征图与输出特征图的通道数,D 1 、D 2
                                                               为 16,采用分类交叉熵作为代价函数。将目标数据
             为网络中卷积层与全连接层的个数。
                                                               集中的 398 张图像作为训练集对模型进行训练,将
                                                               其余的 96 张作为测试集进行测试。对该模型进行
             4 实验分析
                                                               100 次的运行测试,取平均值作为最终模型准确率。
                 为了验证使用二维图像网络实现三维成像声                           图 12 为不同输入数据下 MobileNetV2 模型训练过
             呐点云目标分类任务的可行性,同时对比不同图                             程代价函数值及分类准确率随迭代次数的变化曲
             像输入情况下网络收敛情况,本文设计了以下实                             线,表 2 为不同输入数据下 MobileNetV2 网络的分
             验:首先使用三维成像声呐采集水下目标数据,数                            类结果。
             据采集场地在杭州千岛湖,三维成像声呐通过支架
                                                                      表 2  不同输入数据下模型分类准确率
             固定在水下 2 m 深的位置,观测方向水平,通过线
                                                                  Table 2 Model classification accuracy un-
             缆与上位机相连进行控制与供电,实验过程中目标
                                                                  der different input data
             由可移动的船搭载,在 3 ∼ 30 m 距离内随机移动,
             进行数据采集。三维成像声呐的参数为:工作频率                                      输入数据                 准确率/%
             600 kHz,作用距离 120 m,发射信号为 CW脉冲,脉                              深度图                  90.63
                                                                          强度图                  85.42
             宽 33 ms,距离分辨率为 2.5 cm;接收面阵规模为
                                                                        混合通道图                  91.13
             48 × 48,阵元间距为 2.5 mm,采用 512 个采样通道
             稀疏布阵,接收阵孔径为0.12 m×0.12 m,可以计算                         由训练过程曲线及表中数据可以看出,本文
             得到角度分辨率 1 ,方位角范围 θ α = (−45 ,45 ),                所提出的投影方法结合轻量化卷积神经网络 Mo-
                                                        ◦
                             ◦
                                                    ◦
             俯仰角度范围 θ β = (−45 ,45 )。接着对三维成像                   bilenetv2,可以实现三维点云目标分类任务。在模
                                    ◦
                                       ◦
             声呐获取的回波数据进行波束形成,波束形成过                             型训练过程中,使用混合通道图作为网络输入得到
             程中设置方位向和俯仰向的波束数目 N α = 224、                       的代价函数训练曲线相比单纯使用深度图或者强
             N β = 224,经过最大值滤波以及阈值滤波之后                         度图得到的训练曲线收敛更快,此种情况下模型的
             得到目标三维点云数据,再使用本文所提方法                              分类性能更好。同时,在水下目标分类任务中,将
             将三维点云数据投影至二维图像制作实验数据                              混合通道图作为模型输入得到的分类准确率达到
             集。选取铁框、渔网、绳子 3 种水下物体作为分类                          91.13%,相比深度图和强度图作为模型输入时的分
             的目标,分别建立深度图、强度图及混合通道图                             类准确率平均提高 0.5% 和 5.71%。由此说明,目标
             的数据集。3 个数据集各有 494 张图像,图像尺寸                        的强度深度混合通道图包含深度图和强度图两种

             为 224×224,其中铁框图像 210 张,渔网图像 132                   特征的数据,网络学习到的目标信息更为全面,有利
             张,绳子图像 152 张。使用 MobilenetV2 及其他网                  于提高分类准确率。
   53   54   55   56   57   58   59   60   61   62   63