Page 56 - 《应用声学》2024年第1期
P. 56

52                                                                                   2024 年 1 月


                                                               的 RGB 图像。为了在目标分类任务中充分利用三
                                                               维成像声呐成像结果中的距离信息和强度信息,将
                                                               深度图和强度图进行融合生成混合通道图。如图 5
                                                               流程图所示,混合通道图是三通道 RGB图像,其维
             (a) வ಴ງए༦एڏ     (b) ດᎪງए༦एڏ     (c) ፤ߕງए༦एڏ       度为 N α × N β × 3,单通道强度图作为混合通道图
                                                               的 R 通道,单通道的深度图作为混合通道图的 G 通
                                                               道,混合通道图的B 通道为零矩阵,图8 为使用各个
                                                               目标强度图和深度图生成的混合通道图。


             (d) வ಴ງए॑͢ڏ     (e) ດᎪງए॑͢ڏ     (f) ፤ߕງए॑͢ڏ
                           图 6  不同目标深度图
                           Fig. 6 Depth image

             2.2 点云生成强度图                                        (a) வ಴ຉՌᤰ᥋ڏ     (b) ດᎪຉՌᤰ᥋ڏ    (c) ፤ߕຉՌᤰ᥋ڏ
                 和深度图类似,经过阈值滤波和最大值滤波
                                                                           图 8  不同目标混合通道图
             之后的点云中保存了每个波束方向散射点的强度
                                                                              Fig. 8 Mixd image
             信息 b α,β ,强度信息也经过归一化处理并且映射至
                                                               3 目标分类网络
             0 ∼ 255区间范围,便可以实现强度图的生成:
                              ⌊               ⌋
                                  b α,β
                      B α,β =            × 255 .       (10)        三维成像声呐通常搭载于无人平台或者蛙人
                               max (b α,β )
                                                               手持使用,需要目标分类算法实时运行的情况下同
                 图 7 为生成的强度图为单通道灰度图,同样进
                                                               时具有计算量小和低功耗的特点。目标分类网络
             行伪彩化得到强度伪彩图。
                                                               选用轻量化卷积神经网络MobileNetV2,MobileNet
                                                               是由 Google 在 2017 年提出的新型轻量化网络               [17] ,
                                                               适用于移动和嵌入式设备;MobileNetV2 在其基础
                                                               上进一步改善了网络性能            [18] ,相比普通的全卷积网
                                                               络能够减少 80% ∼ 90% 的计算量,与 VGG16 等常
                                                               用网络相比,具有低消耗和实时性等优点,符合实时
             (a) வ಴ूए༦एڏ     (b) ດᎪूए༦एڏ     (c) ፤ߕूए༦एڏ
                                                               目标分类任务的要求。

                                                               3.1  深度可分离卷积
                                                                   传统标准卷积既过滤输入又将过滤后的输出
                                                               进行组合,最终形成一组新的输出,如图 9(a) 所示。

              (d) வ಴ूए॑͢ڏ    (e) ດᎪूए॑͢ڏ     (f) ፤ߕूए॑͢ڏ       假设卷积核尺寸为 D K ,特征图的大小为 D F ,输入
                                                               通道数为 M,输出通道数为 N,则标准卷积的计算
                           图 7  不同目标强度图
                                                               量为 D K · D K · M · N · D F · D F 。深度可分离卷积
                          Fig. 7 Intensity image
                                                               将一个标准卷积分解成一个深度卷积 (Depthwise
             2.3 混合通道图                                         convolutions) 和一个逐点卷积 (Pointwise convolu-
                 三维成像声呐成像结果三维点云中包含的散                           tions)。深度卷积将输入的每个通道各自与其对应
             射点位置信息和强度信息,分别生成深度图和强度                            的卷积核进行卷积,产生与输入通道数个数相同的
             图。深度图中像素点的值越大,代表该波束方向的                            结果,最后将得到的各个通道对应的卷积结果作为
             散射点距离声呐越远,强度图中像素值越大,代表                            最终的深度卷积结果,完成输入特征图的过滤,如
             该波束方向散射点强度越大。深度图和强度图都是                            图 9(b)所示。深度卷积的计算量为D K ·D K ·M·D F 。
             单通道的灰度图,MobileNetV2 网络输入为三通道                      逐点卷积将深度卷积的结果作为输入,卷积核大小
   51   52   53   54   55   56   57   58   59   60   61