Page 96 - 《应用声学)》2023年第5期
P. 96

988                                                                                  2023 年 9 月


             F(x) 表 示 残 差 模 块 的 拟 合 功 能, 输 出 结 果 为             陷容易检测不到或者效果不佳。由于 PE 管热熔接
             H(x) = F(x) + x。如果某一层的梯度消失,则                      头内部超声相控阵 D 扫视图缺陷特征都比较小,加
             该层的输出等于该层的输入,从而形成一个恒等映                            入低层特征图信息能更好地识别出小缺陷,本研究
             射,不会影响后续网络的学习,这样在加深网络的同                           在残差网络中加入 FPN          [19] 。FPN 模型通将低分辨
             时准确率也不会降低。                                        率、高语义信息的高层特征和高低语义信息的特征
                 原始 Faster-RCNN是自底向上卷积,使用最后                    进行自上而下的侧边连接,使得所有尺度下的特征
             一层特征图进行预测,这是因为最高层的特征具有                            都有丰富的语义信息,且每一层都独立预测,从而
             最丰富的语义信息。这对于大目标的检测很有效,                            提升对小缺陷的检测效果。其核心思想包括3部分:
             但是对于小缺陷来说,当进行卷积、激活、池化到                            一个自底向上的线路、一个自顶向下的线路、横向
             最后一层,实际上语义信息已经没有了,导致小缺                            连接。ResNet50+FPN网络模型如图4所示。

                                                                   FPN
                                                                                         10T10T256
                                                                                Maxpool
                               ResNet50                                         1T1, s2       P6
                                    20T20T2048         20T20T256
                                                                                         20T20T256
                                                     Conv2d                     Conv2d
                         C5      Conv5_x             1T1, s1                    3T3, s1       P5
                                                                  Upsample
                                     40T40T1024        40T40T256
                                                                                         40T40T256
                                                     Conv2d                     Conv2d
                         C4      Conv4_x                             +                        P4
                                                     1T1, s1                    3T3, s1
                                                                  Upsample
                                     80T80T515         80T80T256
                                                                                         80T80T256
                                                     Conv2d                     Conv2d
                         C3      Conv3_x                             +                        P3
                                                     1T1, s1                    3T3, s1
                                                                  Upsample
                                    160T160T256        160T160T256
                                                                                         160T160T256
                                                     Conv2d                     Conv2d
                         C2      Conv2_x                             +                        P2
                                                     1T1, s1                    3T3, s1
                             Conv1(BN+ReLU)
                                640T640T3
                                               图 4  FPN 与 ResNet50 网络结构图
                                      Fig. 4 Structure diagram of FPN and ResNet50 network

                 由 ResNet50+FPN 网络结构图可知,FPN 取                  是 ImageNet数据集的预训练图像大小,k 值应该做
             ResNet50 的输出特征图作为输入,对 C5使用 1 × 1                  取整处理,即所使用的特征层。
             的卷积进行降为处理,再经过3 × 3的卷积处理输出                             本 文 将 CBAM 和 ResNet50+FPN 组 合 在 一
             P5,C5 上采样后与经过降维处理过的 C4 相加,再                       起,形成了一种改进的骨干网络模型。考虑到随
             经 3 × 3 卷积处理,得到 P4,以此类推,从而生成了                     着 CNN 的加深,PE 管接头内部超声相控阵 D 扫图
             不同尺度的特征图,这样用于检测的特征图就包含                            小缺陷信息出现丢失的现象,在 ResNet50 和 FPN
             了多个阶段的特征。然后将 FPN 生成的多层特征                          之间设置了两个注意模块,来关注深层网络中 PE
             图 P2–P5 传入 RPN 层生成候选框,此时需要将候                      管接头超声相控阵小缺陷的特征信息,实现更优的
             选框映射到相应的特征图从而进行接下来的 ROI                           检测性能。然后,将特征信息输入到 FPN 中,进一
             pooling操作  [20] ,具体映射方式见式(4)。                     步融合深层和浅层的特征信息,使它们得到充分研

                                    ( √       )                究。最后将 FPN 生成的多层特征图输入到 RPN 层
                       k = k 0 + log   wh/224 ,         (4)
                                  2
                                                               完成是否包含目标的二分类问题,本文使用的骨干
             式(4) 中:k 0 是映射到 w × h = 224 × 224的 ROI目           网络结构如图 5 所示,其中 C 表示高效通道注意模
             标级别,设置为 4,w 和 h 是 ROI区域的长和宽,224                   块,S表示空间注意模块。
   91   92   93   94   95   96   97   98   99   100   101