Page 77 - 《应用声学》2021年第5期
P. 77
第 40 卷 第 5 期 关鑫等: 基于改进支持向量机的水声目标 -杂波不平衡分类研究 721
波。实验结果表明,对于不平衡数据的分类问题,本 图 3∼5 分别为 SVM、CS-SVM 和 En-SVM 在
文算法 En-SVM 因为考虑了少数类样本不完全采 不同 IR 数据下得到的 ROC 曲线,可以看出,随
样过程中的信息损失,而具有更好的分类性能,更加 着数据 IR 的增大,En-SVM 能够保持良好的性能,
接近贝叶斯最优决策(式(9))。 且 0.5 决策门限下的性能波动程度比 SVM 和 CS-
(2) 数据集不平衡率对算法的影响 SVM 小。实验结果表明,En-SVM 能够充分利用少
本文算法 En-SVM 的核心思想在于度量原始 数类样本不完全采样过程中的信息损失,提升算法
数据空间 (X, Y ) 和样本空间 (X s , Y s ) 正类样本分 性能,并具有一定的稳定性。
布的能量距离来量化正类样本不完全采样过程中
1.0
的信息损失,来补偿 CS-SVM 在 RKHS 中正类样本
的香农熵,使得正类样本能在分类过程中为算法 0.9
提供更强的分类信息,从而使 En-SVM 能够在有限
样本中逼近贝叶斯最优决策,获得更好的分类性 ೝഐဋ 0.8
能。为了进一步验证算法效果,将数据集(表2所示)
0.7
中的目标数量 (+1 表示) 依次从 105 随机下采样为 CS-SVM
IR=245.3
90、60、30,对应的不平衡率 IR 从 245.3 变为 286.2、 0.6 IR=286.2
IR=429.3
429.3 和 858.6,统计 10 次 3 折交叉的 Auc 值,以 “均 IR=858.6
0.5
值±标准差”的形式给出,并得到对应的ROC曲线。 0 0.2 0.4 0.6 0.8 1.0
ᘿഐဋ
由表 3 可以看出,随着 IR 的增大,标准 SVM
的性能明显下降,CS-SVM 性能也有所下降,而 图 4 CS-SVM 的 ROC 曲线
En-SVM的性能保持稳定,Auc值高于其他两者。 Fig. 4 ROC of CS-SVM
表 3 不平衡率对 Auc 值的影响 1.0
Table 3 Effect of unbalance rate on Auc
value 0.9
ೝഐဋ
IR SVM CS-SVM En-SVM 0.8
245.3 0.85 ± 0.16 0.94 ± 0.08 0.97 ± 0.07
0.7
En-SVM
286.2 0.85 ± 0.14 0.95 ± 0.20 0.97 ± 0.06 IR=245.3
0.6 IR=286.2
429.3 0.78 ± 0.20 0.90 ± 0.04 0.97 ± 0.15 IR=429.3
IR=858.6
858.6 0.56 ± 0.11 0.86 ± 0.15 0.95 ± 0.06
0.5
0 0.2 0.4 0.6 0.8 1.0
ᘿഐဋ
1.0
SVM
IR=245.3 图 5 En-SVM 的 ROC 曲线
IR=286.2
0.9
IR=429.3 Fig. 5 ROC of En-SVM
IR=858.6
ೝഐဋ 0.8 4 结论
0.7
本文针对少数类样本在不完全采样过程中存
在信息损失,结合能量统计法提出了En-SVM算法,
0.6
在处理水声目标 -杂波不平衡数据中有着良好的分
0.5
0 0.2 0.4 0.6 0.8 1.0 类效果。实际海试数据的处理结果表明,En-SVM
ᘿഐဋ
算法能够在有限样本中更加逼近贝叶斯最优决策,
图 3 标准 SVM 的 ROC 曲线 并且对样本的不平衡率变化不敏感,验证了算法的
Fig. 3 ROC of Standard SVM 有效性和稳定性。本文采用的水声数据集建立在高