Page 96 - 《应用声学》2023年第3期
P. 96
534 2023 年 5 月
1.2 超声衰减分类识别网络框架搭建 更复杂和抽象的特征。
1.2.1 分类识别网络的选择 超声波在金属材料中的传播衰减是超声波传
播路径上每个局部区域的衰减之和。已有的研究表
近年来随着计算机算力、深度学习框架以及
明,当弹性波在复杂的微结构介质中传播时,会出现
数据采集能力的飞速发展,深度学习作为一种多
许多复杂的波传播现象。弹性波的振幅和相位被调
级表示学习在面对各类表示学习问题时显示了强
制 [4] 。因此,为了实现利用背散射波预测材料的超
大的处理能力。各类深度学习神经网络模型在相
声衰减,需要声束传播路径中每个局部区域内背散
关领域也取得了令人瞩目的成果,如前馈神经网
射波幅度和相位变化都被检测到。
络 (Artificial neural network, ANN) [11] 、递归神经
本文中设计的 CNN 最浅层只关注局部区域的
网络 [12] 、卷积神经网络 (Convolutional neural net-
背散射波幅度及相位变化,而不考虑远端区域的背
work, CNN) [6] 以及近年热门的基于注意力机制
散射波变化。卷积层的局部性原理确保可以聚合局
(Transformer) [13] 等。其中 CNN 因其能利用卷积
部区域的背散射波幅度及相位变化,以对超声波在
核进行多通道的互相关运算,从图像中直接提取特
的整个传播路径的衰减进行预测。卷积层的平移不
征图,实现高效利用模型内参数,使得其在计算机视
变性可以检测传播路径内任何区域的低级背散射
觉及自然语言处理领域均取得优异的表现 [14−15] 。
模式。其他更高层的卷积层可以学习背散射波信号
典型的 CNN 由多个神经网络层所组成,包含
的高层次表示。卷积层中输入和输出的通道允许模
卷积层、池化层、全连接层等,各层中的参数通过反
型在传播路径的每个空间位置捕获背散射波信号
向传播算法学习得到。卷积层利用其内部的多个卷
中多种类型的幅度及相位变化。最后,将卷积网络
积核进行互相关运算 (cross-correlation),输入张量
得到的高层次表示输入到全连接神经网络中,以搜
和卷积核张量通过互相关运算得到输出张量,卷积
索更高层次背散射波的幅度及相位特征与衰减特
层的作用多为检测步进维度上的特征。池化层的作
性之间的关系。
用则是降低位置的敏感性、降低对空间降采样的敏
感性以及正则化。全连接层实现最终分类识别概率 ᣥКϙ ᣥКྲढ़
的计算。因此,卷积层与池化层往往组合使用。最终
ᫎ
利用全连接层将所提取得到的特征转换为分类识 ଢԩѣᄊऀѵ
别的结果。采用 CNN 作为材料超声背散射波识别
模型有着诸多优势。首先,CNN 通过参数共享,仅 ˁԄሥϢགሥ Ԅሥ
采用较小的参数量也能够有效地提取各个时域范
围内超声背散射波的特征;其次,CNN 不需要人工 ᣥѣ ᣥѣྲढ़
设计的特征提取器来进行数据特征的提取,而是采
用学习算法直接从训练数据集中学习得到。 图 4 一维 CNN 中卷积层单步处理输入序列段
Fig. 4 The convolutional layer of 1D CNN pro-
处理图像数据的二维 CNN 所具有的局部性和
cesses the input sequence segments in a single step
平移不变性在一维 CNN 对序列数据进行处理时也
同样有效 [16] 。时间可以被视作为一个空间维度,类 1.2.2 背散射波分类识别网络模型
比于二维图像中的高度和宽度。图4为一维CNN中 本文针对超声背散射波检测时的实际情况,在
卷积层的工作原理图。一维 CNN 中的一维卷积层 序列数据分类检测研究中常用的一维CNN 基础上,
通过一维卷积核从序列中提取局部一维序列段 (即 提出一种通过材料超声背散射波检测材料超声波
子序列)。这种一维卷积层可以识别序列中的局部 衰减的算法。
模式。因为对每个序列段执行相同的输入变换,所 图 5 和表 1 为网络架构图以及超参数设置。模
以在背散射波中某个位置学到的波形特征可以在 型的层数设置需要考虑输入数据维度及训练数据
其他位置被识别,这使得一维 CNN 具有平移不变 集体量,本文中输入数据为 1250 × 1,训练数据 864
性(对于时间平移而言)。由一维卷积层叠加组成的 条。考虑到本文中所采用的数据集体量较小,为
一维 CNN 可以学习到特征的时间层次结构。模型 有效对训练数据进行学习的同时尽量减少模型过
所具有的层次结构使 CNN 能够有效地学习数据中 拟合,模型构架采用 7 个学习层组成——4 个一维