Page 77 - 《应用声学》2021年第5期
P. 77

第 40 卷 第 5 期         关鑫等: 基于改进支持向量机的水声目标 -杂波不平衡分类研究                                         721


             波。实验结果表明,对于不平衡数据的分类问题,本                               图 3∼5 分别为 SVM、CS-SVM 和 En-SVM 在
             文算法 En-SVM 因为考虑了少数类样本不完全采                         不同 IR 数据下得到的 ROC 曲线,可以看出,随
             样过程中的信息损失,而具有更好的分类性能,更加                           着数据 IR 的增大,En-SVM 能够保持良好的性能,
             接近贝叶斯最优决策(式(9))。                                  且 0.5 决策门限下的性能波动程度比 SVM 和 CS-
                 (2) 数据集不平衡率对算法的影响                             SVM 小。实验结果表明,En-SVM 能够充分利用少
                 本文算法 En-SVM 的核心思想在于度量原始                       数类样本不完全采样过程中的信息损失,提升算法
             数据空间 (X, Y ) 和样本空间 (X s , Y s ) 正类样本分             性能,并具有一定的稳定性。
             布的能量距离来量化正类样本不完全采样过程中
                                                                      1.0
             的信息损失,来补偿 CS-SVM 在 RKHS 中正类样本
             的香农熵,使得正类样本能在分类过程中为算法                                    0.9
             提供更强的分类信息,从而使 En-SVM 能够在有限
             样本中逼近贝叶斯最优决策,获得更好的分类性                                   ೝ฾ഐဋ  0.8
             能。为了进一步验证算法效果,将数据集(表2所示)
                                                                      0.7
             中的目标数量 (+1 表示) 依次从 105 随机下采样为                                                   CS-SVM
                                                                                              IR=245.3
             90、60、30,对应的不平衡率 IR 从 245.3 变为 286.2、                    0.6                     IR=286.2
                                                                                              IR=429.3
             429.3 和 858.6,统计 10 次 3 折交叉的 Auc 值,以 “均                                          IR=858.6
                                                                      0.5
             值±标准差”的形式给出,并得到对应的ROC曲线。                                    0    0.2   0.4   0.6    0.8   1.0
                                                                                      ᘿ᝝ഐဋ
                 由表 3 可以看出,随着 IR 的增大,标准 SVM
             的性能明显下降,CS-SVM 性能也有所下降,而                                      图 4  CS-SVM 的 ROC 曲线
             En-SVM的性能保持稳定,Auc值高于其他两者。                                      Fig. 4 ROC of CS-SVM

                      表 3   不平衡率对 Auc 值的影响                            1.0

                Table 3 Effect of unbalance rate on Auc
                value                                                 0.9

                                                                     ೝ฾ഐဋ
                 IR       SVM       CS-SVM       En-SVM               0.8
                245.3  0.85 ± 0.16  0.94 ± 0.08  0.97 ± 0.07
                                                                      0.7
                                                                                             En-SVM
                286.2  0.85 ± 0.14  0.95 ± 0.20  0.97 ± 0.06                                  IR=245.3
                                                                      0.6                     IR=286.2
                429.3  0.78 ± 0.20  0.90 ± 0.04  0.97 ± 0.15                                  IR=429.3
                                                                                              IR=858.6
                858.6  0.56 ± 0.11  0.86 ± 0.15  0.95 ± 0.06
                                                                      0.5
                                                                         0    0.2   0.4   0.6    0.8   1.0
                                                                                      ᘿ᝝ഐဋ
                   1.0
                            SVM
                             IR=245.3                                      图 5  En-SVM 的 ROC 曲线
                             IR=286.2
                   0.9
                             IR=429.3                                       Fig. 5 ROC of En-SVM
                             IR=858.6
                  ೝ฾ഐဋ  0.8                                    4 结论
                   0.7
                                                                   本文针对少数类样本在不完全采样过程中存
                                                               在信息损失,结合能量统计法提出了En-SVM算法,
                   0.6
                                                               在处理水声目标 -杂波不平衡数据中有着良好的分
                   0.5
                      0     0.2   0.4   0.6   0.8   1.0        类效果。实际海试数据的处理结果表明,En-SVM
                                   ᘿ᝝ഐဋ
                                                               算法能够在有限样本中更加逼近贝叶斯最优决策,
                        图 3  标准 SVM 的 ROC 曲线                   并且对样本的不平衡率变化不敏感,验证了算法的
                       Fig. 3 ROC of Standard SVM              有效性和稳定性。本文采用的水声数据集建立在高
   72   73   74   75   76   77   78   79   80   81   82