Page 177 - 201903
P. 177
第 38 卷 第 3 期 李萍等: 深度学习在超声检测缺陷识别中的应用与发展 459
1.1 浅层神经网络
0 引言 早期神经网络模型在1943年提出 [5] ,提供输入
后,使用线性加权和来模拟变换,然后经过一个阈值
超声检测是一种应用范围较广的无损检测方 函数得到 0 或 1 的结果,具有若干个输入和一个输
法 [1] ,对缺陷进行定性和定量分析是超声检测的关 出的模型。最早期是手动设置权重,1958 年提出单
键内容。仅通过超声检测信号对缺陷进行人工识 层感知机模型,是首个根据样本数据来学习权重的
别,鲁棒性差,长时间的检测强度可能会引起缺陷 模型,但其只能解决线性可分问题。1986 年提出反
的漏判错判,准确率受到限制。超声检测原始结果 向传播 (Back propagation, BP) 算法及多层感知机
多用 A 扫信号表示 [2] ,随着阵列检测技术的发展, (Multilayer perceptron, MLP)。BP 算法降低了训
超声检测结果也越来越多地通过图像表示,如扫描 练神经网络所需要的时间,多层感知机在输入和输
超声成像、相控阵成像、超声 CT、合成孔径聚焦技 出层之间加入隐藏层,且在单个神经元中的线性加
术 (Synthetic aperture focusing technique SAFT) 权和后引入了激活函数,带来非线性变换,解决非线
成像等。相应的,基于长期以来对超声缺陷自动判 性问题。只使用一层隐藏层称为浅层神经网络,浅
别的发展需要,借鉴于模式识别中深度学习 (Deep 层神经网络在20世纪80年代末迎来了发展高峰期。
learning) 的应用,即通过搭建多层的网络结构来建 90 年代末,其他浅层机器学习算法相继提出,
立输入与输出的关系,得到识别的结果,发展了很多 有突破性的进展,如支持向量机 (Support vector
方法用于超声检测缺陷识别。由最初的超声检测 A machine, SVM)、线性回归、决策树等,这些方法在
扫波形做信号处理提取特征,通过浅层神经网络进 理论分析和应用都获得了成功 [6] 。深层神经网络 [7]
行识别,到现在尝试直接使用深度学习模型处理超 也就是深度学习主要指具有多层变换对复杂性数
声检测图像得到识别结果。 据建模算法的神经网络,多层网络对输入信号提取
深度学习用于缺陷识别的主要步骤为将原始 不同的特征,相比于浅层,其表征能力更强,但其多
数据处理为适用的范围,再提取特征来表征信号,最 层的变换理论分析较难,训练需要很多经验和技巧,
后将不同特征信号进行分类 [3] 。深度学习从早期的 在当时的计算性能下很难训练深层的神经网络,而
浅层神经网络发展到了深层神经网络也就是深度 且当时的数据量相对较小,不能满足深层神经网络
学习,而相比于手动提取低层次的特征,卷积神经网 训练的需求,因此浅层神经网络在向深层神经网络
发展时比较缓慢。
络(Convolutional neural network, CNN) 能自动提
取信号的深层次特征 [4] 。 1.2 深层神经网络——深度学习
本文综述了深度学习在超声检测缺陷识别中
随着计算机性能的提高以及云计算、GPU的出
的应用,包括从早期浅层神经网络的应用到如今深
现,计算量已经不再是问题。随着互联网的发展,通
度学习的使用,探讨了基于 CNN 框架的深度学习 过网上保存数据、共享数据,使得获取海量数据不
方法在超声检测图像识别存在的问题,并归纳了其 再困难。2006年,机器学习领域的泰斗 Hinton等 [4]
可行的应对策略。 在学术刊物《Neural Computation》上的一篇文章,
开启了学术界和工业界的深层神经网络也就是深
1 深度学习的发展 度学习浪潮,深度学习理论研究渐入佳境,且在应用
领域显示出巨大潜力。在 2012 年迎来了历史性突
深度学习作为机器学习的一个分支,意在建立 破后,深度学习已经扩展到机器学习的所有领域。
能模拟人脑进行分析学习的神经网络,通过构建多 深层神经网络通过组合低级特征形成抽象的
隐藏层模型对海量数据进行训练。在深度学习之前, 高级特征,以表征数据的分布式特征 [7] ,最典型的
发展了浅层神经网络,随着计算机辅助能力的提升, 模型有递归神经网络 (Recurrent neural networks,
多层网络的理论研究加强,逐渐发展成为深层神经 RNN)、长短期记忆网络(Long short-term memory,
网络,也就是深度学习。 LSTM)/门控递归单元网络 (Gated recurrent unit,