Page 58 - 《应用声学》2024年第1期

P. 58

54 2024 年 1 月

3.4 模型复杂度评估络模型作为特征提取部分对网络进行训练，对比
网络模型的复杂度通常使用参数量和计算量不同输入下模型的训练、测试结果，验证混合通
进行评估，卷积层和全连接层的参数量和计算量可道图对水下目标的分类效果。实验使用的所有
以表示为网络均基于 Keras 深度学习框架基础，实验计算
 机采用 CPU 为 6 核 i7-10750H、Windows 操作系统、
D 1
∑
 2

 P cnn = K · C l−1 · C l ,
 l GPU为RTX2070。

l=1 (12)
D 1 4.1 不同输入数据下 MobileNetV2 模型分类
 ∑
 2 2
F cnn = M · K · C l−1 · C l ,

 l l 准确率
l=1
使用上述数据集，分别将水下目标的深度伪彩
D 2
∑
P dense = F dense = C l−1 · C l , (13) 图、强度伪彩图及深度强度混合通道图作为网络
l=1
的输入部分，利用 MobileNetV2 模型对水下目标进
行分类。根据网络和数据集设置的学习率大小为
其中，P 和 F 分别代表模型的参数量和计算量，M l
和K l 分别表示输入图片的尺寸和卷积核大小，C l−1
0.00005，迭代次数设置为 100，训练批次 batchsize
和C l 为输入特征图与输出特征图的通道数，D 1 、D 2
为 16，采用分类交叉熵作为代价函数。将目标数据
为网络中卷积层与全连接层的个数。
集中的 398 张图像作为训练集对模型进行训练，将
其余的 96 张作为测试集进行测试。对该模型进行
4 实验分析
100 次的运行测试，取平均值作为最终模型准确率。
为了验证使用二维图像网络实现三维成像声图 12 为不同输入数据下 MobileNetV2 模型训练过
呐点云目标分类任务的可行性，同时对比不同图程代价函数值及分类准确率随迭代次数的变化曲
像输入情况下网络收敛情况，本文设计了以下实线，表 2 为不同输入数据下 MobileNetV2 网络的分
验：首先使用三维成像声呐采集水下目标数据，数类结果。
据采集场地在杭州千岛湖，三维成像声呐通过支架
表 2 不同输入数据下模型分类准确率
固定在水下 2 m 深的位置，观测方向水平，通过线
Table 2 Model classiﬁcation accuracy un-
缆与上位机相连进行控制与供电，实验过程中目标
der diﬀerent input data
由可移动的船搭载，在 3 ∼ 30 m 距离内随机移动，
进行数据采集。三维成像声呐的参数为：工作频率输入数据准确率/%
600 kHz，作用距离 120 m，发射信号为 CW脉冲，脉深度图 90.63
强度图 85.42
宽 33 ms，距离分辨率为 2.5 cm；接收面阵规模为
混合通道图 91.13
48 × 48，阵元间距为 2.5 mm，采用 512 个采样通道
稀疏布阵，接收阵孔径为0.12 m×0.12 m，可以计算由训练过程曲线及表中数据可以看出，本文
得到角度分辨率 1 ，方位角范围 θ α = (−45 ,45 )，所提出的投影方法结合轻量化卷积神经网络 Mo-
◦
◦
◦
俯仰角度范围 θ β = (−45 ,45 )。接着对三维成像 bilenetv2，可以实现三维点云目标分类任务。在模
◦
◦
声呐获取的回波数据进行波束形成，波束形成过型训练过程中，使用混合通道图作为网络输入得到
程中设置方位向和俯仰向的波束数目 N α = 224、的代价函数训练曲线相比单纯使用深度图或者强
N β = 224，经过最大值滤波以及阈值滤波之后度图得到的训练曲线收敛更快，此种情况下模型的
得到目标三维点云数据，再使用本文所提方法分类性能更好。同时，在水下目标分类任务中，将
将三维点云数据投影至二维图像制作实验数据混合通道图作为模型输入得到的分类准确率达到
集。选取铁框、渔网、绳子 3 种水下物体作为分类 91.13%，相比深度图和强度图作为模型输入时的分
的目标，分别建立深度图、强度图及混合通道图类准确率平均提高 0.5% 和 5.71%。由此说明，目标
的数据集。3 个数据集各有 494 张图像，图像尺寸的强度深度混合通道图包含深度图和强度图两种

为 224×224，其中铁框图像 210 张，渔网图像 132 特征的数据，网络学习到的目标信息更为全面，有利
张，绳子图像 152 张。使用 MobilenetV2 及其他网于提高分类准确率。

53 54 55 56 57 58 59 60 61 62 63