Page 96 - 《应用声学)》2023年第5期
P. 96
988 2023 年 9 月
F(x) 表 示 残 差 模 块 的 拟 合 功 能, 输 出 结 果 为 陷容易检测不到或者效果不佳。由于 PE 管热熔接
H(x) = F(x) + x。如果某一层的梯度消失,则 头内部超声相控阵 D 扫视图缺陷特征都比较小,加
该层的输出等于该层的输入,从而形成一个恒等映 入低层特征图信息能更好地识别出小缺陷,本研究
射,不会影响后续网络的学习,这样在加深网络的同 在残差网络中加入 FPN [19] 。FPN 模型通将低分辨
时准确率也不会降低。 率、高语义信息的高层特征和高低语义信息的特征
原始 Faster-RCNN是自底向上卷积,使用最后 进行自上而下的侧边连接,使得所有尺度下的特征
一层特征图进行预测,这是因为最高层的特征具有 都有丰富的语义信息,且每一层都独立预测,从而
最丰富的语义信息。这对于大目标的检测很有效, 提升对小缺陷的检测效果。其核心思想包括3部分:
但是对于小缺陷来说,当进行卷积、激活、池化到 一个自底向上的线路、一个自顶向下的线路、横向
最后一层,实际上语义信息已经没有了,导致小缺 连接。ResNet50+FPN网络模型如图4所示。
FPN
10T10T256
Maxpool
ResNet50 1T1, s2 P6
20T20T2048 20T20T256
20T20T256
Conv2d Conv2d
C5 Conv5_x 1T1, s1 3T3, s1 P5
Upsample
40T40T1024 40T40T256
40T40T256
Conv2d Conv2d
C4 Conv4_x + P4
1T1, s1 3T3, s1
Upsample
80T80T515 80T80T256
80T80T256
Conv2d Conv2d
C3 Conv3_x + P3
1T1, s1 3T3, s1
Upsample
160T160T256 160T160T256
160T160T256
Conv2d Conv2d
C2 Conv2_x + P2
1T1, s1 3T3, s1
Conv1(BN+ReLU)
640T640T3
图 4 FPN 与 ResNet50 网络结构图
Fig. 4 Structure diagram of FPN and ResNet50 network
由 ResNet50+FPN 网络结构图可知,FPN 取 是 ImageNet数据集的预训练图像大小,k 值应该做
ResNet50 的输出特征图作为输入,对 C5使用 1 × 1 取整处理,即所使用的特征层。
的卷积进行降为处理,再经过3 × 3的卷积处理输出 本 文 将 CBAM 和 ResNet50+FPN 组 合 在 一
P5,C5 上采样后与经过降维处理过的 C4 相加,再 起,形成了一种改进的骨干网络模型。考虑到随
经 3 × 3 卷积处理,得到 P4,以此类推,从而生成了 着 CNN 的加深,PE 管接头内部超声相控阵 D 扫图
不同尺度的特征图,这样用于检测的特征图就包含 小缺陷信息出现丢失的现象,在 ResNet50 和 FPN
了多个阶段的特征。然后将 FPN 生成的多层特征 之间设置了两个注意模块,来关注深层网络中 PE
图 P2–P5 传入 RPN 层生成候选框,此时需要将候 管接头超声相控阵小缺陷的特征信息,实现更优的
选框映射到相应的特征图从而进行接下来的 ROI 检测性能。然后,将特征信息输入到 FPN 中,进一
pooling操作 [20] ,具体映射方式见式(4)。 步融合深层和浅层的特征信息,使它们得到充分研
( √ ) 究。最后将 FPN 生成的多层特征图输入到 RPN 层
k = k 0 + log wh/224 , (4)
2
完成是否包含目标的二分类问题,本文使用的骨干
式(4) 中:k 0 是映射到 w × h = 224 × 224的 ROI目 网络结构如图 5 所示,其中 C 表示高效通道注意模
标级别,设置为 4,w 和 h 是 ROI区域的长和宽,224 块,S表示空间注意模块。