Page 56 - 《应用声学》2024年第1期
P. 56
52 2024 年 1 月
的 RGB 图像。为了在目标分类任务中充分利用三
维成像声呐成像结果中的距离信息和强度信息,将
深度图和强度图进行融合生成混合通道图。如图 5
流程图所示,混合通道图是三通道 RGB图像,其维
(a) வງए༦एڏ (b) ດᎪງए༦एڏ (c) ፤ߕງए༦एڏ 度为 N α × N β × 3,单通道强度图作为混合通道图
的 R 通道,单通道的深度图作为混合通道图的 G 通
道,混合通道图的B 通道为零矩阵,图8 为使用各个
目标强度图和深度图生成的混合通道图。
(d) வງए॑͢ڏ (e) ດᎪງए॑͢ڏ (f) ፤ߕງए॑͢ڏ
图 6 不同目标深度图
Fig. 6 Depth image
2.2 点云生成强度图 (a) வຉՌᤰ᥋ڏ (b) ດᎪຉՌᤰ᥋ڏ (c) ፤ߕຉՌᤰ᥋ڏ
和深度图类似,经过阈值滤波和最大值滤波
图 8 不同目标混合通道图
之后的点云中保存了每个波束方向散射点的强度
Fig. 8 Mixd image
信息 b α,β ,强度信息也经过归一化处理并且映射至
3 目标分类网络
0 ∼ 255区间范围,便可以实现强度图的生成:
⌊ ⌋
b α,β
B α,β = × 255 . (10) 三维成像声呐通常搭载于无人平台或者蛙人
max (b α,β )
手持使用,需要目标分类算法实时运行的情况下同
图 7 为生成的强度图为单通道灰度图,同样进
时具有计算量小和低功耗的特点。目标分类网络
行伪彩化得到强度伪彩图。
选用轻量化卷积神经网络MobileNetV2,MobileNet
是由 Google 在 2017 年提出的新型轻量化网络 [17] ,
适用于移动和嵌入式设备;MobileNetV2 在其基础
上进一步改善了网络性能 [18] ,相比普通的全卷积网
络能够减少 80% ∼ 90% 的计算量,与 VGG16 等常
用网络相比,具有低消耗和实时性等优点,符合实时
(a) வूए༦एڏ (b) ດᎪूए༦एڏ (c) ፤ߕूए༦एڏ
目标分类任务的要求。
3.1 深度可分离卷积
传统标准卷积既过滤输入又将过滤后的输出
进行组合,最终形成一组新的输出,如图 9(a) 所示。
(d) வूए॑͢ڏ (e) ດᎪूए॑͢ڏ (f) ፤ߕूए॑͢ڏ 假设卷积核尺寸为 D K ,特征图的大小为 D F ,输入
通道数为 M,输出通道数为 N,则标准卷积的计算
图 7 不同目标强度图
量为 D K · D K · M · N · D F · D F 。深度可分离卷积
Fig. 7 Intensity image
将一个标准卷积分解成一个深度卷积 (Depthwise
2.3 混合通道图 convolutions) 和一个逐点卷积 (Pointwise convolu-
三维成像声呐成像结果三维点云中包含的散 tions)。深度卷积将输入的每个通道各自与其对应
射点位置信息和强度信息,分别生成深度图和强度 的卷积核进行卷积,产生与输入通道数个数相同的
图。深度图中像素点的值越大,代表该波束方向的 结果,最后将得到的各个通道对应的卷积结果作为
散射点距离声呐越远,强度图中像素值越大,代表 最终的深度卷积结果,完成输入特征图的过滤,如
该波束方向散射点强度越大。深度图和强度图都是 图 9(b)所示。深度卷积的计算量为D K ·D K ·M·D F 。
单通道的灰度图,MobileNetV2 网络输入为三通道 逐点卷积将深度卷积的结果作为输入,卷积核大小