Page 173 - 《应用声学》2023年第6期
P. 173

第 42 卷 第 6 期         符书楠等: 结合区域提取和改进卷积神经网络的水下小目标检测                                         1283



                                             ӝ۫ࡇए
                                              ಣ൤                       ܦڏܙू






                                                                                        MRF Ѭҟ



                                             ӝ۫ଢԩ                      ࡇࠪጞౌ

                                 ROI



                                                    图 2  区域提取流程图
                                            Fig. 2 The flowchart of region extraction

             2 特征融合分类网络                                          H 3 = (η  − 3η 12 ) + (3η  − η 03 ) ,   (12)
                                                                                                2
                                                                                 2
                                                                        30              21
                                                                                2             2
                                                                 H 4 = (η  + η 12 ) + (η  + η 03 ) ,     (13)
             2.1 Hu矩特征                                                  30            21
                 水下小目标的基础特征是形状特征、尺寸特征                            H 5 = (η 30 − 3η 12 ) (η 30 + η 12 )
                                                                         [                         ]
                                                                                    2
             等,可作为主要特征用于目标分类。Hu 矩特征                     [19]           × (η 30 + η 12 ) − 3 (η 21 + η 03 ) 2
             是一种有效描述目标形状的矩特征,具有平移、旋
                                                                       + (3η 21 − η 03 ) (η 21 + η 03 )
             转和尺度不变性,不受目标位置和方向影响,常作为                                     [           2            2 ]
             水下目标特征,应用于小目标分类               [20−21] 。                   × 3 (η 30 + η 12 ) − (η 21 + η 03 )  ,  (14)
                                                                                 [                        ]
                 设 f(x, y)(x = 1, · · · , M,y = 1, · · · , N) 为大  H 6 = (η 20 − η 02 ) (η 30 + η 12 ) − (η 21 + η 03 ) 2
                                                                                            2
             小M × N 图像在(x, y)处的灰度值,则它的p + q 阶
                                                                       + 4η 11 (η 30 + η 12 ) (η 21 + η 03 ) ,  (15)
             几何矩m pq 定义为
                                                                 H 7 = (3η 21 − η 03 ) (η 30 + η 12 )
                      M  N
                     ∑ ∑                                                 [                         ]
                             p q
                                                                                    2
               m pq =       x y f(x, y), p, q=0, 1, 2, · · ·  (7)      × (η 30 + η 12 ) − 3 (η 21 + η 03 ) 2
                     x=1 y=1
                                                                       − (η 30 − 3η 12 ) (η 21 + η 03 )
                 通过几何矩 m pq 构建的中心矩反映了图像灰
                                                                         [                         ]
                                                                                     2
             度相对于灰度重心的分布,p + q 阶中心矩 µ pq 如                             × 3 (η 30 + η 12 ) − (η 21 + η 03 ) 2  ,  (16)
             式 (8)所示:
                                                               上述 7 个 Hu 矩构成了目标的形状特征 H = (H 1 ,
                       M  N
                      ∑ ∑                                      H 2 , H 3 , H 4 , H 5 , H 6 , H 7 )。
                                    p
                                            q
                µ pq =       (x − x 0 ) (y − y 0 ) f(x, y),  (8)
                      x=1 y=1                                  2.2  融合Hu矩特征的改进CNN
             其中,(x 0 , y 0 ) 是图像的重心坐标,x 0 = m 10 /m 00 ,
                                                                   LeNet-5  [22]  是 由 Lecun 于 1998 年 提 出 的 7 层
             y 0 = m 01 /m 00 。
                                                               CNN,主要用于手写数字识别,常用于低分辨率
                 该图像的p + q 阶归一化中心矩η pq 定义为
                                                               图像的分类。本文以 LeNet-5为基础,设计包含3 个
                                     µ pq
                               η pq =   ,               (9)    卷积层、3 个池化层、3 个全连接层的基础 CNN 结
                                     µ r 00
                                                               构,其中激活函数采用 ReLU 函数。各网络层详情
             其中,r = (p + q)/2 + 1。
                                                               如表2所示。
                 通过式 (9) 归一化中心矩的多种线性组合,可
                                                                   由于 CNN 的多层卷积和池化易使潜在目标的
             计算出7个Hu矩,如式(10)∼(16)所示:
                                                               部分底层特征丢失,为进一步增强CNN分类特征的
               H 1 = η 20 + η 02 ,                     (10)    表征能力,在基础 CNN 中融入 Hu 矩特征,构建融
                              2     2
               H 2 = (η  − η 02 ) + 4η ,               (11)    合 Hu 矩的改进 CNN (Hu-CNN),最终构建的由两
                      20           11
   168   169   170   171   172   173   174   175   176   177   178