Page 95 - 《应用声学)》2023年第5期
P. 95

第 42 卷 第 5 期    彭伊娟等: 改进的 Faster-RCNN 算法在聚乙烯管接头内部缺陷检测中的应用                                   987

                                          తܸ෉ӑ


                                                                                     M C
                                F
                                          ࣱک෉ӑ                                    ᤰ᥋ฌਓҧిϙ
                              ᣥКྲढ़
                                                        С̚Лᤌଌࡏ
                                                     (a) ᤰ᥋ฌਓҧവڱ




                                                       Ԅሥࡏ
                                                                             M S
                                       F '
                                  ፃ᣿ᤰ᥋ฌਓҧവ
                                   ڱՑᄊྲढ़ڏ
                                              తܸ෉ӑ                     ቇᫎฌਓҧిϙ
                                              ࣱک෉ӑ
                                                     (b) ቇᫎฌਓҧവڱ
                                                   图 2  CBAM 模块的结构
                                               Fig. 2 Structure of CBAM model

             函数为 ReLU。将 MLP 输出特征进行 element-wise                入到骨干网络中,来关注深层网络中 PE 管接头超
             加和操作,再通过一个 sigmoid 激活函数生成最终                       声相控阵 D 扫图小缺陷的特征信息,提升对小缺陷
             的通道注意力特征图,即M C ,计算公式见式(2)。最                       的检测性能。
             后,将 M C 和输入特征图 F 相乘生成空间注意力模
                                                               2.2  骨干网络
             块的输入特征F ,见式(1)。
                           ′
                                                                   本文将 ResNet50 与 FPN 相融合形成骨干网
                M C (F)                                        络。ResNet50 通过构建残差块可以解决深度网络
             = σ (MLP (avgpool(F))) + (MLP (maxpool(F)))       退化问题。如图 3 所示,其中 x 表示残差模块的输
                 (   (    (  c  ))           c   )
             = σ W 1 W 0 F  avg  + W 1 (W 0 (F max )) ,  (2)   入,当特征图输入到特征提取网络中,通过 1×1
                                                               的卷积核进行降维、3×3 的卷积核进行特征提取、
             式 (2) 中,W 0 ∈ R  C/r×C ,W 1 ∈ R C×C/r ,σ 表示
                                                               1×1 的卷积核进行升维,最后得到 256 维度的特征
             sigmoid激活函数。
                 空间注意图是根据特征间的空间关系生成的,                          图。而残差模块在输入和输出之间建立了直接连接,
             空间注意模块主要关注特征信息的位置                  [18] ,是对通
                                                                                        256-d
             道注意力的补充,如图2(b)所示。首先,在通道轴上
                                                                                x
                                                        S
             应用平均池化与最大池化来生成两个特征图,F                      avg           Stride: 1
                 S
             和 F max ,将两个特征图进行通道拼接,生成有效的
                                                                             Conv, BN, ReLU, 1T1, 64
             特征描述符,通过卷积层将描述符简化为一个通道。
             然后使用 sigmoid 函数将其激活,生成空间注意图,                             Stride: 1
             计算公式见式 (3)。最后空间注意力图乘以输入特                                        Conv, BN, ReLU, 3T3, 64
             征图,得到最终的注意力特征图F ,见式(1)。
                                           ′′
                                                                      Stride: 1  F↼x↽
                         ′
                   M S (F )                                                  Conv, BN, ReLU, 1T1, 256
                     (  7×7                          )
                 = σ f     (avgpool (F ) ; maxpool (F ))
                                     ′
                                                   ′
                     (  7×7  (  S  S  ))
                 = σ f      F avg ; F max  ,            (3)                           +
             式 (3) 中:σ 表示 sigmoid 激活函数,f      7×7  表示卷积                        F↼x↽⇁x     ReLU
             核为7 × 7的卷积。
                                                                            图 3  ResNet50 残差结构
                 CBAM 补充了由通道注意力聚焦的语义信息
                                                                      Fig. 3 Residual structure of ResNet50
             和由空间注意力聚焦的位置信息,本文将CBAM加
   90   91   92   93   94   95   96   97   98   99   100