Page 95 - 《应用声学)》2023年第5期
P. 95
第 42 卷 第 5 期 彭伊娟等: 改进的 Faster-RCNN 算法在聚乙烯管接头内部缺陷检测中的应用 987
తܸӑ
M C
F
ࣱکӑ ᤰ᥋ฌਓҧిϙ
ᣥКྲढ़
С̚Лᤌଌࡏ
(a) ᤰ᥋ฌਓҧവڱ
Ԅሥࡏ
M S
F '
ፃᤰ᥋ฌਓҧവ
ڱՑᄊྲढ़ڏ
తܸӑ ቇᫎฌਓҧిϙ
ࣱکӑ
(b) ቇᫎฌਓҧവڱ
图 2 CBAM 模块的结构
Fig. 2 Structure of CBAM model
函数为 ReLU。将 MLP 输出特征进行 element-wise 入到骨干网络中,来关注深层网络中 PE 管接头超
加和操作,再通过一个 sigmoid 激活函数生成最终 声相控阵 D 扫图小缺陷的特征信息,提升对小缺陷
的通道注意力特征图,即M C ,计算公式见式(2)。最 的检测性能。
后,将 M C 和输入特征图 F 相乘生成空间注意力模
2.2 骨干网络
块的输入特征F ,见式(1)。
′
本文将 ResNet50 与 FPN 相融合形成骨干网
M C (F) 络。ResNet50 通过构建残差块可以解决深度网络
= σ (MLP (avgpool(F))) + (MLP (maxpool(F))) 退化问题。如图 3 所示,其中 x 表示残差模块的输
( ( ( c )) c )
= σ W 1 W 0 F avg + W 1 (W 0 (F max )) , (2) 入,当特征图输入到特征提取网络中,通过 1×1
的卷积核进行降维、3×3 的卷积核进行特征提取、
式 (2) 中,W 0 ∈ R C/r×C ,W 1 ∈ R C×C/r ,σ 表示
1×1 的卷积核进行升维,最后得到 256 维度的特征
sigmoid激活函数。
空间注意图是根据特征间的空间关系生成的, 图。而残差模块在输入和输出之间建立了直接连接,
空间注意模块主要关注特征信息的位置 [18] ,是对通
256-d
道注意力的补充,如图2(b)所示。首先,在通道轴上
x
S
应用平均池化与最大池化来生成两个特征图,F avg Stride: 1
S
和 F max ,将两个特征图进行通道拼接,生成有效的
Conv, BN, ReLU, 1T1, 64
特征描述符,通过卷积层将描述符简化为一个通道。
然后使用 sigmoid 函数将其激活,生成空间注意图, Stride: 1
计算公式见式 (3)。最后空间注意力图乘以输入特 Conv, BN, ReLU, 3T3, 64
征图,得到最终的注意力特征图F ,见式(1)。
′′
Stride: 1 F↼x↽
′
M S (F ) Conv, BN, ReLU, 1T1, 256
( 7×7 )
= σ f (avgpool (F ) ; maxpool (F ))
′
′
( 7×7 ( S S ))
= σ f F avg ; F max , (3) +
式 (3) 中:σ 表示 sigmoid 激活函数,f 7×7 表示卷积 F↼x↽⇁x ReLU
核为7 × 7的卷积。
图 3 ResNet50 残差结构
CBAM 补充了由通道注意力聚焦的语义信息
Fig. 3 Residual structure of ResNet50
和由空间注意力聚焦的位置信息,本文将CBAM加