Page 195 - 《应用声学》2023年第3期
P. 195

第 42 卷 第 3 期              孟子轩等: 基于非负矩阵分解的次声信号分类方法                                           633


                 图 5 中左侧为信号的字典矩阵,右侧为激活矩                        量、时域熵、EMD能量、EMD熵等4 种特征,在上述
             阵。结合图3 与图 5,可以看出字典矩阵是对信号时                         实验条件下进行分类实验,分别使用 SVM 与一维
             频谱的一种降维表示,不同类之间的字典矩阵有明                            CNN作为分类器,其结果见表1。
             显差异,因此本文选取 W 作为信号的特征向量进
                                                                     18
             行分类实验。                                                                               ஝૶ᝮै
                                                                     16
                                                                                                  લՌజጳ
             2.2 实验环境                                                14
                                                                     12
                 本文使用的数据集中训练集与测试集的比例
             为7 : 3,由于数据量有限,因此不再设计验证集,而                             ѣဘ൓஝  10 8
             是在训练时采用四折交叉验证的方式进行模型选                                    6
             择。识别分类实验包括两部分,分别是基于经验模                                   4
             态分解 (Empirical mode decomposition, EMD) 和                2
             NMF 的识别分类实验。分类实验在 AMD®4600H                              0  50  55  60  65  70  75  80  85  90
             平台上进行,操作系统为 Windows10,所用软件为                                             юᆸဋ/%
             Python3.6.8,CNN 的开发框架为 Tensorflow2.4.0,
                                                                         图 6  HMS-SVM 测试集分类结果
             SVM模型由Sklearn模块提供。
                                                                 Fig. 6 Test set classification results of HMS-SVM
             2.3 实验结果与分析
                                                                            表 1  5 种特征分类结果
             2.3.1 基于EMD的分类过程
                                                                  Table 1 Five feature classification results
                 基于 EMD 的特征提取主要是对分解得到的各
             阶本征模态函数(Intrinsic mode function, IMF) 分                  使用特征            测试集准确率平均值/%
             量进行处理      [3,5] ,可选择的处理方式包括计算分量                         时域能量                   67.78
             各阶矩、能量、信息熵、波形特征、分量比等,经处                                   时域熵                   58.06
             理后的各分量仍可继续提取其能量、信息熵或波                                    EMD 能量                 60.93
             形特征等特征。本文采用时域能量、时域熵、EMD                                  EMD 熵                  68.73
             能量、EMD 熵、EMD 奇异值以及希尔伯特边际谱                                  HMS                  67.94
             (Hilbert marginal spectrum, HMS) [21] 4 种特征作
                                                                   从表 1 中可以看出,在本文所使用的数据集中,
             为对比。以 HMS 为例,对识别分类过程进行说明。
                                                               5 种特征中最高的准确率为 EMD 熵特征,达到了
             提取 HMS 时首先对时域信号进行 EMD,将得到的
                                                               68.71%。进行 EMD 后使用熵作为特征的准确率提
             IMF进行希尔伯特变换,构造出原信号的解析信号,
                                                               升较高,而使用能量作为特征的准确率则有所下降。
             从而得到原信号的希尔伯特谱,HMS 即为希尔伯
                                                               在进行实验前无法确定最优的特征提取方式,需
             特谱的时间维积分结果,反映了瞬时频率的时域幅
                                                               要根据分类结果对特征向量进行设计以获取最佳
             值累加。对得到的 HMS进行主成分分析 (Principal
                                                               特征。
             component analysis, PCA),取前30维作为SVM输
             入进行分类。本文采取随机优化的方式对 SVM 进                          2.3.2 基于NMF的分类过程
             行参数选择,以相同条件进行100次分类实验,在测                              使用 NMF 进行特征提取时,除字典原子个数
             试集上的分类结果如图6所示。                                    外,还需要考虑距离度量函数的选取。本文比较了
                 图6中横坐标为HMS-SVM在测试集上的分类                        欧几里得距离 (β = 2)、广义 K-L 散度 (β = 1) 和 IS
             准确率,纵坐标则表示在 100 次实验中不同准确率                         散度 (β = 0) 三种距离度量函数下不同字典原子个
             出现的次数,蓝色柱状图为实验数据记录,红色曲                            数的分类结果。分别采用SVM与CNN作为分类器,
             线为使用正态分布拟合的结果。从图 6 中可以看                           在相同条件下进行 100 次分类实验,取分类准确率
             出,HMS-SVM 在测试集上的分类准确率最大值为                         的平均值作为最终结果,实验结果如图 7 所示。3 种
             87.5%,平均值为 69.76%,方差为 7.65%,多数分类                  距离度量函数下,在验证集上平均准确率的最大值
             结果集中在 60%∼80% 之间。本文还提取了时域能                        见表2。
   190   191   192   193   194   195   196   197   198   199   200