Page 54 - 《应该声学》2022年第2期
P. 54

222                                                                                  2022 年 3 月


             类器。为实现听觉谱特征的非线性分类,选取径向                            4.2  融合特征确定
             基函数作为核函数进行支持向量机的建模:                                   为进一步提高识别准确率,本文中把这 7 类
                                              2                特征随机融合成为特征向量,输入到支持向量
                       f(u, v) = exp(−γ ∗ |u − v| ).   (14)
                                                               机进行分类,每组特征向量进行 20 次试验,记录
             其中,γ 为核参数,u 和 v 为径向基函数的输入向量。
                                                               下每次试验的识别准确率并求其平均值。经过
             支持向量机中的惩罚因子 c 和核参数 γ 使用遗传算                             ∑ 7     i
                                                               20 ×       C = 2540 次试验之后,得到识别准确
                                                                           7
             法寻优   [22] ,并使用五折交叉验证确定参数,遗传算                             i=1
                                                               率随融合特征数目变化曲线,如图6所示。
             法优化的支持向量机各项参数设置如表2所示。
                                                                   由图 6 可知,融合特征后的煤矸识别准确率均
                                                               高于单个特征的识别准确率,且随着融合的特征数
                  表 2  遗传算法优化的支持向量机参数设置
                                                               目增加,识别准确率呈现先增加后减少的趋势。当
                Table 2  Parameters setting of support
                                                               融合3 类特征时,识别准确率达到最大值为 97.64%,
                vector machine optimized by genetic al-
                                                               此时融合的 3类特征分别为:听觉谱能量、功率熵和
                gorithm
                                                               峭度。当融合的特征数目超过 3 个之后,识别准确
                      参数名称                 参数值                 率开始下降,这是由于当输入特征维度增加到一定
                       核函数                径向基函数                程度后,随着维度的增加,可能会引入原始听觉信号
                    最大进化代数                   100               的一些次要关系、噪声和冗余信息,进而影响识别
                    最大种群数量                   20
                                                               准确率。
                      交叉概率                   0.4
                      变异概率                  0.01                    98
                     c 取值范围               0.1 ∼ 100
                     γ 取值范围              0.01 ∼ 1000                96
                                                                   គѿድए/%  94
                      交叉验证               五折交叉验证

                 为验证提取的 7 类特征对垮落煤矸识别是否有
             效,首先使用上述支持向量机对单个特征进行分类                                 92
             识别试验,每类特征进行 20 次试验,记录下每次试
                                                                    90
             验的识别准确率并求其平均值,得到如表 3 所示的                                 1     2     3     4     5    6     7
             单个特征平均识别准确率。                                                           ᚸՌྲढ़஝᧚
                                                                     图 6  识别准确率随融合特征数目变化曲线
                     表 3   单个特征的平均识别准确率
                                                                  Fig. 6  Variation curve of recognition accuracy
                Table 3 Average recognition accuracy for          with the number of fusion features
                a single feature
                                                               4.3  方法对比
                      特征名称               测试精度/%                    为验证所提方法优越性,将本文所提方法
                       能量                  90.36               (ASF) 与传统的基于时域、频域和时频域提取特
                      能量熵                  88.07
                                                               征的方法进行比较。对比试验中,提取一类时域
                      能量矩                  85.29
                                                               特征:峭度 (Kurtosis);一类频域特征:谱质心
                      功率熵                  83.86
                                                               (Spectral centroid, SC);两类时频域特征:基于经
                       偏度                  81.71
                                                               验模态分解的各固有模态分量的能量 (Spectrum
                       峭度                  79.86
                      奇异值                  72.00               energy of intrinsic mode function based on empir-
                                                               ical mode decomposition, SEI)、希尔伯特能谱熵
                 由表 3 可知,基于听觉谱提取的单个特征已经                        (Hilbert spectral entropy, ESEH);常用的声音识别
             实现了较高的识别准确率,其中听觉谱的能量、能                            特征:梅尔频率倒谱系数 (Mel-Frequency cepstral
             量熵和能量矩识别准确率均在 85% 以上,证明听觉                         coefficients, MFCC)、分形盒维数 (Fractal box di-
             谱特征为有效识别特征。                                       mension, FBD)。各对比方法所使用训练集与测试
   49   50   51   52   53   54   55   56   57   58   59