Page 168 - 《应用声学》2023年第1期
P. 168

164                                                                                  2023 年 1 月


             分界线的准确性要求很高,分界线选取的不同,获得                           题转化为相应的对偶问题,即:
             的分区统计占比值 κ 的范围也不同,以致于分界线                                       ∑       1  ∑ ∑
                                                                                           l
                                                                             l
                                                                                       l
                                                                max Q (a) =     a j −        a i a j y i y j (x i · x j ),
             的确定过于绝对化、线性化、片面化,使得不同试件                                                2
                                                                            j=1       j=1 j=1
             的统计结果之间的差距较大,仅仅依赖单一变量统
                                                                  l
                                                                ∑
             计分析结果进行信号分类识别的误差大。因此需要                                 a j y j = 0,  j = 1, 2, · · · , l,
             借助于数学工具,采用智能化的分析手段,通过从某                             j=1
             一个或几个特征参量的变化来确定材料早期损伤                                a j > 0,  j = 1, 2, · · · , l,          (4)
             阶段微裂纹萌生或扩展的状态识别。                                  解得最优解a = (a , a , · · · , a ) 。
                                                                                           ∗ T
                                                                                 ∗
                                                                           ∗
                                                                                    ∗
                                                                                 1  2      l
                 多元统计分析方法是通过对多个随机变量观                               计算最优权值向量w 和最优偏置b ,分别为
                                                                                      ∗
                                                                                                   ∗
             测数据进行分析,研究变量之间的相互关系,并                                              l
                                                                               ∑
                                                                                   ∗
                                                                           ∗
             且揭示这些变量内在的变化规律。而支持向量机                                        w =     a y j x j ,             (5)
                                                                                   j
                                                                               j=1
             (Support vector machine, SVM) 是建立在统计学
                                                                                    l
             习理论基础上的一种数据挖掘方法,能非常成功地                                        ∗       ∑     ∗
                                                                          b = y i −   y j a (x j · x i ) ,  (6)
                                                                                         j
             处理回归问题 (时间序列分析) 和模式识别 (分类问                                            j=1
                                                                             {       }
             题、判别分析) 等诸多问题,并可推广于预测和综合                          其中,下标 j ∈ j a ≻ 0 。因此得到最优分类超
                                                                                 ∗
                                                                                 j
             评价等领域和学科。SVM 的机理是寻找一个满足                           平面(w · x) + b = 0,而最优分类函数为
                                                                              ∗
                                                                      ∗
             分类要求的最优分类超平面,使得该超平面在保证                                             ∗       ∗
                                                                   f(x) = sgn {(w · x) + b }
             分类精度的同时,能够使超平面两侧的空白区域最                                                         
                                                                           l
                                                                         ∑                    
             大化。理论上,SVM 能够实现对线性可分数据的最                            = sgn      a y j (x j · x i )   + b ∗  , x∈R . (7)
                                                                                                       n
                                                                              ∗
                                                                              j
             优分类,通过寻找超平面对给定的向量进行分类。                                      j=1                  
             当特征数为 2 的时候,根据数据集中样本的二维特                          4.2  基于 SVM 的早期损伤阶段声信号识别结果
             征值,将其作为x坐标和y 坐标,绘制在二维平面中,                              统计分析
             其中实心圆形和空心圆形分别代表不同分类的样                                 本文采用上述 B1∼B6 试件早期损伤阶段的声
             本点,对于不同声源的识别,即试样是否发生微裂纹                           学数据,按照不带堆焊层和带堆焊层的试件类型,
             萌生或扩展,SVM 方法在于从其中找出一个直线,                          构建出 3 种不同的训练样本集。其中,训练样本集
             能够将两类样本点分离开,从而确定分类结果。                             包含两类 AE 信号数据。一类是指同时满足幅值
                 对于具备 p 个特征的数据,其特征向量为 p 维                      > 45 dB 且能量 > 15的声信号,即代表损伤过程中
             向量,SVM 计算的是能够将两类样本数据完全分                           的微裂纹萌生或扩展所产生的声信号;另一类是指
             离开来的 p − 1 维超平面,给定训练样本集 (x i , y i ),             满足幅值6 45 dB或能量 6 15的声信号,即代表损
             i = 1, 2, · · · , l,x ∈ R ,y = {±1},超平面记作         伤过程中的其他所有微观组织损伤机制所产生的
                                 n
             (w · x) + b = 0,为使分类面对所有样本正确分                     声信号,如表8所示。
             类并且具备分类间隔,就要求它满足如下约束:
                                                                            表 8  不同的训练样本集
             y i [w · x) + b] > 1,i = 1, 2, · · · , l。计算出分类间隔
                                                                  Table 8 Composition of different training
             为2/∥w∥,因此,构造最优超平面的问题就转化为在                            sample sets
             约束式下求
                                1    2   1                       训练样本集     样本集 1    样本集 2        样本集 3
                                             ′
                    min ϕ (w) =   ∥w∥ =    (w · w) .    (2)
                                2        2                       数据类型     不带堆焊层 带堆焊层        不带堆焊层 + 带堆焊层
             为了解决该个约束最优化问题,引入 Lagrange                           信号数目        174      140          314
                                                                 一类信号        36       33           69
             函数:
                                                                 二类信号        138      107          245
                          1
              L (w, b, α) =  ∥w∥ − a (y ((w · x) + b) − 1) , (3)
                          2                                        由表8可知,训练样本集1是由174个不带堆焊
             式(3) 中,a > 0 为 Lagrange乘数。约束最优化问题                 层试样的典型 AE信号构成,其中一类信号为36个,
             的解由 Lagrange函数的鞍点决定,并且最优化问题                       二类信号为 138个;训练样本集2 是由140个带堆焊
             的解在鞍点处满足对 w 和 b 的偏导为 0,将该 QP 问                    层试样的典型 AE信号构成,其中一类信号为33个,
   163   164   165   166   167   168   169   170   171   172   173