Page 58 - 《应用声学》2024年第1期
P. 58
54 2024 年 1 月
3.4 模型复杂度评估 络模型作为特征提取部分对网络进行训练,对比
网络模型的复杂度通常使用参数量和计算量 不同输入下模型的训练、测试结果,验证混合通
进行评估,卷积层和全连接层的参数量和计算量可 道图对水下目标的分类效果。实验使用的所有
以表示为 网络均基于 Keras 深度学习框架基础,实验计算
机采用 CPU 为 6 核 i7-10750H、Windows 操作系统、
D 1
∑
2
P cnn = K · C l−1 · C l ,
l GPU为RTX2070。
l=1 (12)
D 1 4.1 不同 输 入 数 据 下 MobileNetV2 模型 分 类
∑
2 2
F cnn = M · K · C l−1 · C l ,
l l 准确率
l=1
使用上述数据集,分别将水下目标的深度伪彩
D 2
∑
P dense = F dense = C l−1 · C l , (13) 图、强度伪彩图及深度强度混合通道图作为网络
l=1
的输入部分,利用 MobileNetV2 模型对水下目标进
行分类。根据网络和数据集设置的学习率大小为
其中,P 和 F 分别代表模型的参数量和计算量,M l
和K l 分别表示输入图片的尺寸和卷积核大小,C l−1
0.00005,迭代次数设置为 100,训练批次 batchsize
和C l 为输入特征图与输出特征图的通道数,D 1 、D 2
为 16,采用分类交叉熵作为代价函数。将目标数据
为网络中卷积层与全连接层的个数。
集中的 398 张图像作为训练集对模型进行训练,将
其余的 96 张作为测试集进行测试。对该模型进行
4 实验分析
100 次的运行测试,取平均值作为最终模型准确率。
为了验证使用二维图像网络实现三维成像声 图 12 为不同输入数据下 MobileNetV2 模型训练过
呐点云目标分类任务的可行性,同时对比不同图 程代价函数值及分类准确率随迭代次数的变化曲
像输入情况下网络收敛情况,本文设计了以下实 线,表 2 为不同输入数据下 MobileNetV2 网络的分
验:首先使用三维成像声呐采集水下目标数据,数 类结果。
据采集场地在杭州千岛湖,三维成像声呐通过支架
表 2 不同输入数据下模型分类准确率
固定在水下 2 m 深的位置,观测方向水平,通过线
Table 2 Model classification accuracy un-
缆与上位机相连进行控制与供电,实验过程中目标
der different input data
由可移动的船搭载,在 3 ∼ 30 m 距离内随机移动,
进行数据采集。三维成像声呐的参数为:工作频率 输入数据 准确率/%
600 kHz,作用距离 120 m,发射信号为 CW脉冲,脉 深度图 90.63
强度图 85.42
宽 33 ms,距离分辨率为 2.5 cm;接收面阵规模为
混合通道图 91.13
48 × 48,阵元间距为 2.5 mm,采用 512 个采样通道
稀疏布阵,接收阵孔径为0.12 m×0.12 m,可以计算 由训练过程曲线及表中数据可以看出,本文
得到角度分辨率 1 ,方位角范围 θ α = (−45 ,45 ), 所提出的投影方法结合轻量化卷积神经网络 Mo-
◦
◦
◦
俯仰角度范围 θ β = (−45 ,45 )。接着对三维成像 bilenetv2,可以实现三维点云目标分类任务。在模
◦
◦
声呐获取的回波数据进行波束形成,波束形成过 型训练过程中,使用混合通道图作为网络输入得到
程中设置方位向和俯仰向的波束数目 N α = 224、 的代价函数训练曲线相比单纯使用深度图或者强
N β = 224,经过最大值滤波以及阈值滤波之后 度图得到的训练曲线收敛更快,此种情况下模型的
得到目标三维点云数据,再使用本文所提方法 分类性能更好。同时,在水下目标分类任务中,将
将三维点云数据投影至二维图像制作实验数据 混合通道图作为模型输入得到的分类准确率达到
集。选取铁框、渔网、绳子 3 种水下物体作为分类 91.13%,相比深度图和强度图作为模型输入时的分
的目标,分别建立深度图、强度图及混合通道图 类准确率平均提高 0.5% 和 5.71%。由此说明,目标
的数据集。3 个数据集各有 494 张图像,图像尺寸 的强度深度混合通道图包含深度图和强度图两种
为 224×224,其中铁框图像 210 张,渔网图像 132 特征的数据,网络学习到的目标信息更为全面,有利
张,绳子图像 152 张。使用 MobilenetV2 及其他网 于提高分类准确率。