Page 96 - 《应用声学》2023年第3期
P. 96

534                                                                                  2023 年 5 月


             1.2 超声衰减分类识别网络框架搭建                                更复杂和抽象的特征。
             1.2.1 分类识别网络的选择                                       超声波在金属材料中的传播衰减是超声波传
                                                               播路径上每个局部区域的衰减之和。已有的研究表
                 近年来随着计算机算力、深度学习框架以及
                                                               明,当弹性波在复杂的微结构介质中传播时,会出现
             数据采集能力的飞速发展,深度学习作为一种多
                                                               许多复杂的波传播现象。弹性波的振幅和相位被调
             级表示学习在面对各类表示学习问题时显示了强
                                                               制 [4] 。因此,为了实现利用背散射波预测材料的超
             大的处理能力。各类深度学习神经网络模型在相
                                                               声衰减,需要声束传播路径中每个局部区域内背散
             关领域也取得了令人瞩目的成果,如前馈神经网
                                                               射波幅度和相位变化都被检测到。
             络 (Artificial neural network, ANN)  [11] 、递归神经
                                                                   本文中设计的 CNN 最浅层只关注局部区域的
             网络  [12] 、卷积神经网络 (Convolutional neural net-
                                                               背散射波幅度及相位变化,而不考虑远端区域的背
             work, CNN)  [6]  以及近年热门的基于注意力机制
                                                               散射波变化。卷积层的局部性原理确保可以聚合局
             (Transformer)  [13]  等。其中 CNN 因其能利用卷积
                                                               部区域的背散射波幅度及相位变化,以对超声波在
             核进行多通道的互相关运算,从图像中直接提取特
                                                               的整个传播路径的衰减进行预测。卷积层的平移不
             征图,实现高效利用模型内参数,使得其在计算机视
                                                               变性可以检测传播路径内任何区域的低级背散射
             觉及自然语言处理领域均取得优异的表现                    [14−15] 。
                                                               模式。其他更高层的卷积层可以学习背散射波信号
                 典型的 CNN 由多个神经网络层所组成,包含
                                                               的高层次表示。卷积层中输入和输出的通道允许模
             卷积层、池化层、全连接层等,各层中的参数通过反
                                                               型在传播路径的每个空间位置捕获背散射波信号
             向传播算法学习得到。卷积层利用其内部的多个卷
                                                               中多种类型的幅度及相位变化。最后,将卷积网络
             积核进行互相关运算 (cross-correlation),输入张量
                                                               得到的高层次表示输入到全连接神经网络中,以搜
             和卷积核张量通过互相关运算得到输出张量,卷积
                                                               索更高层次背散射波的幅度及相位特征与衰减特
             层的作用多为检测步进维度上的特征。池化层的作
                                                               性之间的关系。
             用则是降低位置的敏感性、降低对空间降采样的敏
             感性以及正则化。全连接层实现最终分类识别概率                                 ᣥК஝ϙ                           ᣥКྲढ़
             的计算。因此,卷积层与池化层往往组合使用。最终
                                                                                                ௑ᫎ
             利用全连接层将所提取得到的特征转换为分类识                                                 ଢԩѣᄊऀѵ඀
             别的结果。采用 CNN 作为材料超声背散射波识别
             模型有着诸多优势。首先,CNN 通过参数共享,仅                               ˁԄሥ಩Ϣགሥ               Ԅሥ಩
             采用较小的参数量也能够有效地提取各个时域范
             围内超声背散射波的特征;其次,CNN 不需要人工                               ᣥѣ஝૶                           ᣥѣྲढ़
             设计的特征提取器来进行数据特征的提取,而是采
             用学习算法直接从训练数据集中学习得到。                                  图 4  一维 CNN 中卷积层单步处理输入序列段
                                                                  Fig. 4 The convolutional layer of 1D CNN pro-
                 处理图像数据的二维 CNN 所具有的局部性和
                                                                  cesses the input sequence segments in a single step
             平移不变性在一维 CNN 对序列数据进行处理时也
             同样有效    [16] 。时间可以被视作为一个空间维度,类                    1.2.2 背散射波分类识别网络模型
             比于二维图像中的高度和宽度。图4为一维CNN中                               本文针对超声背散射波检测时的实际情况,在
             卷积层的工作原理图。一维 CNN 中的一维卷积层                          序列数据分类检测研究中常用的一维CNN 基础上,
             通过一维卷积核从序列中提取局部一维序列段 (即                           提出一种通过材料超声背散射波检测材料超声波
             子序列)。这种一维卷积层可以识别序列中的局部                            衰减的算法。
             模式。因为对每个序列段执行相同的输入变换,所                                图 5 和表 1 为网络架构图以及超参数设置。模
             以在背散射波中某个位置学到的波形特征可以在                             型的层数设置需要考虑输入数据维度及训练数据
             其他位置被识别,这使得一维 CNN 具有平移不变                          集体量,本文中输入数据为 1250 × 1,训练数据 864
             性(对于时间平移而言)。由一维卷积层叠加组成的                           条。考虑到本文中所采用的数据集体量较小,为
             一维 CNN 可以学习到特征的时间层次结构。模型                          有效对训练数据进行学习的同时尽量减少模型过
             所具有的层次结构使 CNN 能够有效地学习数据中                          拟合,模型构架采用 7 个学习层组成——4 个一维
   91   92   93   94   95   96   97   98   99   100   101