Page 88 - 《应用声学)》2023年第5期
P. 88

980                                                                                  2023 年 9 月


             非其次过程,即                                           0.84、0.8。因此确定近邻参数 k = 5,此时 LLE 算法
                                 n                             降维后融合特征的聚类效果如图13所示。
                                ∑
                      N(t, x) =    I {x i ∈ S x (r)},  (19)
                                i=1                                 0.9
             式 (19) 中,I {x i ∈ S x (r)} 为示性函数,用泊松分布                 0.8
             近似该过程可得                                                0.7

                                                                                               ኄ̄᫽඀
                         λ(t) = f(x)V (d)dt d−1 ,      (20)         0.6                        ኄʷ᫽඀
                                                                                               ኄʼ᫽඀
                                                                   គѿဋ  0.5                    ኄپ᫽඀
             式 (20) 中,V (d) 为 d 维空间下球的体积函数。令                        0.4
             θ = lg(f(x)),则N(t)的似然函数可表示为                            0.3
                           r                r
                         ∫                ∫                         0.2
                L(d, θ) =   lg λ(t)dN(t) −   λ(t)dt.   (21)
                                                                    0.1
                          0                0
                                                                     0
                                                                      0   2  4   6  8  10  12  14  16  18  20
                                ∂l        ∂l                                         ᥶۫Ԡ஝K
                 在两个约束条件           = 0 和     = 0下,d r (x)可
                                ∂θ       ∂d
             以表示为                                                 图 12  不同近邻参数下各融合特征的敏感度之和
                                               −1               Fig. 12 The sum of the sensitivities of each fusion
                                N(r,x)  (     )
                           1     ∑         r                      feature under different neighbor parameters
               d r (x) =            lg           .   (22)
                         N(r, x)         T j (x)
                                 j=1
                                                                   从图 13(a) 和图 13(b) 可以看出:dim1 和 dim2
                 将近邻数 k 作为球半径 r,局部极大似然估计
                                                               特征区分得第一阶段与后三个阶段分布相隔较远,
             d k (x)可表示为
                                                               而 dim1 和 dim3 特征区分的 4 种状态分布都靠的比
                                              
                                 k−1  (       )                较近,呈一条水平线趋势,且各状态交叉混叠数
                             1   ∑      T k (x i )
                  d k (x) =        lg           ,    (23)    目较少,只有在第四状态下存在一个样本判别不
                           k − 1        T j (x i )
                                 j=1
                                                               了。结合图 13(c) 可以看出,第一状态没有一个样
             式 (23) 中,T k (x i ) 是样本点 x i 与第 k 个近邻点的欧          本错判,且 4 个状态相比于 PCA降维后的聚类效果
             式距离。分别求解每个样本点对应的特征维数,并                            更集中。
             计算其平均值,将其当作全局特征维数d,即
                                   n                           4 两种算法融合特征值的敏感度对比分析
                                1  ∑
                           d k =      d k (x i ).      (24)
                                n
                                  i=1
                                                                   为了更好地比较两种降维方法的优劣,利用
                 通过上述极大似然估计法计算砂岩声发射信
                                                               散步矩阵法计算 PCA 及 LLE 算法在 d = 4、k = 5
             号特征数据集的低维子空间维数 d = 4,因此,利用
                                                               参数下对矩阵 M 降维后的融合特征的敏感度之
             LLE算法对样本数据降维后得到4维的融合特征向
                                                               和。散布矩阵包含类间和类内两种散布矩阵,特
                 ′
             量T new 。                                          征的散布值可由这两个矩阵分析得到。设有 M 类
                 由于不同近邻参数取值会对所得融合特征产
                                                               破裂状态,每种状态的样本数为 N。原始特征向
             生影响,为分析其不同取值的影响效果,先选择固定
                                                               量 x = (x 1 , x 2 , · · · , x D ),原始特征向量的维数用 D
             本征维数 d = 4,然后改变近邻参数 k 的取值,利用
                                                               表示。
             支持向量机 (Support vector machines, SVM) 对融
                                                                   类间散布矩阵:定义一个 S b ,表达式如式 (25)
             合特征向量进行特征识别,评价标准为各个阶段的
                                                               所示。特征的类间散布值越大,其类间辨识度则
             识别准确率。图12为不同近邻参数k 下各阶段识别
                                                               越好。
             率曲线关系。
                                                                             M
                 由图 12 中可以看出:随着 k 值的变化,降维后                             S b =  ∑ N i (u i − u o )(u i − u o ) ,  (25)
                                                                                                   T
             所得到的融合特征经 SVM 识别后,识别率发生较                                       i=1
             大波动,第二阶段下识别率明显偏高,且当k = 5时,                        式(25)中,u i 表示第i类特征值的均值;u o 表示总体
             4 个阶段的识别率都达到最大,分别为 0.84、0.88、                     样本的全局均值向量。
   83   84   85   86   87   88   89   90   91   92   93