Page 173 - 《应用声学》2023年第6期
P. 173
第 42 卷 第 6 期 符书楠等: 结合区域提取和改进卷积神经网络的水下小目标检测 1283
ӝ۫ࡇए
ಣ ܦڏܙू
MRF Ѭҟ
ӝ۫ଢԩ ࡇࠪጞౌ
ROI
图 2 区域提取流程图
Fig. 2 The flowchart of region extraction
2 特征融合分类网络 H 3 = (η − 3η 12 ) + (3η − η 03 ) , (12)
2
2
30 21
2 2
H 4 = (η + η 12 ) + (η + η 03 ) , (13)
2.1 Hu矩特征 30 21
水下小目标的基础特征是形状特征、尺寸特征 H 5 = (η 30 − 3η 12 ) (η 30 + η 12 )
[ ]
2
等,可作为主要特征用于目标分类。Hu 矩特征 [19] × (η 30 + η 12 ) − 3 (η 21 + η 03 ) 2
是一种有效描述目标形状的矩特征,具有平移、旋
+ (3η 21 − η 03 ) (η 21 + η 03 )
转和尺度不变性,不受目标位置和方向影响,常作为 [ 2 2 ]
水下目标特征,应用于小目标分类 [20−21] 。 × 3 (η 30 + η 12 ) − (η 21 + η 03 ) , (14)
[ ]
设 f(x, y)(x = 1, · · · , M,y = 1, · · · , N) 为大 H 6 = (η 20 − η 02 ) (η 30 + η 12 ) − (η 21 + η 03 ) 2
2
小M × N 图像在(x, y)处的灰度值,则它的p + q 阶
+ 4η 11 (η 30 + η 12 ) (η 21 + η 03 ) , (15)
几何矩m pq 定义为
H 7 = (3η 21 − η 03 ) (η 30 + η 12 )
M N
∑ ∑ [ ]
p q
2
m pq = x y f(x, y), p, q=0, 1, 2, · · · (7) × (η 30 + η 12 ) − 3 (η 21 + η 03 ) 2
x=1 y=1
− (η 30 − 3η 12 ) (η 21 + η 03 )
通过几何矩 m pq 构建的中心矩反映了图像灰
[ ]
2
度相对于灰度重心的分布,p + q 阶中心矩 µ pq 如 × 3 (η 30 + η 12 ) − (η 21 + η 03 ) 2 , (16)
式 (8)所示:
上述 7 个 Hu 矩构成了目标的形状特征 H = (H 1 ,
M N
∑ ∑ H 2 , H 3 , H 4 , H 5 , H 6 , H 7 )。
p
q
µ pq = (x − x 0 ) (y − y 0 ) f(x, y), (8)
x=1 y=1 2.2 融合Hu矩特征的改进CNN
其中,(x 0 , y 0 ) 是图像的重心坐标,x 0 = m 10 /m 00 ,
LeNet-5 [22] 是 由 Lecun 于 1998 年 提 出 的 7 层
y 0 = m 01 /m 00 。
CNN,主要用于手写数字识别,常用于低分辨率
该图像的p + q 阶归一化中心矩η pq 定义为
图像的分类。本文以 LeNet-5为基础,设计包含3 个
µ pq
η pq = , (9) 卷积层、3 个池化层、3 个全连接层的基础 CNN 结
µ r 00
构,其中激活函数采用 ReLU 函数。各网络层详情
其中,r = (p + q)/2 + 1。
如表2所示。
通过式 (9) 归一化中心矩的多种线性组合,可
由于 CNN 的多层卷积和池化易使潜在目标的
计算出7个Hu矩,如式(10)∼(16)所示:
部分底层特征丢失,为进一步增强CNN分类特征的
H 1 = η 20 + η 02 , (10) 表征能力,在基础 CNN 中融入 Hu 矩特征,构建融
2 2
H 2 = (η − η 02 ) + 4η , (11) 合 Hu 矩的改进 CNN (Hu-CNN),最终构建的由两
20 11