Page 140 - 《应用声学》2020年第3期
P. 140
460 2020 年 5 月
行特征提取与种数识别。为便于比较,各算法按照
100
识别率从低到高的顺序依次列于表1。
90 86.21%
表 1 识别率对比
គѿဋ/%
Table 1 Comparison table of recognition rate 80
(单位: %)
识别率 2 种 5 种 10 种 15 种 70 MFCC+GMM
LBP+SVM
LBP+KNN
LBP+SVM 94 79.4 70.2 74.8 60 LBP+RF
HOG+SVM
MFCC+GMM [5] 95.5 80.6 78.6 69.6 HOG+KNN
HOG+RF
50
LBP+RF 95 86.4 80.4 74 0 2 4 6 8 10 12 14 16
HOG+RF 98.5 91 90.2 88.8 Ლዝመ
LBP+KNN 100 93 88.6 83 (a) គѿဋࠫඋڏ
HOG+SVM 100 95.6 89.7 86.8
HOG+KNN 100 97.4 93.8 90.5
100
观察并分析表1 中的数据,VPS-BR算法下的6
90
种组合模型平均识别率为 80.9%,较MFCC+GMM
组合模型高出 11.3%,证明 VPS-BR识别算法(即从 គѿဋ/% 80
VPS提取LBP与HOG两类特征,再与SVM、KNN、 70
RF 三种分类器两两组合) 比 MFCC+GMM 的组合
60
模型具有更高的识别率。其主要原因是鸟鸣声一维
50
波形信号被转换为二维能量谱图,通过增加维度引
B C D E F G H
入更多高性能的多特征提取及识别算法对识别增 LBP+RF
益有直接贡献。为更好地比较不同模型的识别性 FCC+GMM LBP+SVM LBP+KNN HOG+SVM HOG+KNN HOG+RF
能,再将表 1 中的 7 种模型对 2 种 ∼ 15 种鸟类的识 ጸՌവی
(b) គѿဋኸጳڏ
别情况示于图9。
图 9 MFCC+GMM 模型与 VPS-BR 算法各模型
如图 9(a) 所示,尽管每一波形样本所含噪声不
识别性能对比
尽相同,各模型识别变化趋势也略有波动,但总体
Fig. 9 Comparison of recognition performance
看,随着识别种数增加,这7 种模型的识别率均逐渐 between MFCC+GMM model and VPS-BR algo-
减小,而且图 9(b) 箱线图显示 VPS-BR 算法各模型 rithm
识别率比较稳定,多数优于MFCC+GMM。还可看
出,在种数较少情况下,SVM和KNN分类器性能表 由图 10 可以看出,随着分块维度 N 增加,识别
现较好;在种数较多情况下,KNN 分类器性能仍然 耗时均逐渐减少。相比于前文提到的 HOG+KNN
较为突出,RF 分类器识别率略高于 MFCC+GMM 模型,识别耗时缩短了 91.1%。对于相同分块维
组合模型。图 9 中还显示 LBP+SVM 组合模型较 度,采用 MBCS-LBP 方法在识别时间上的开销比
MFCC+GMM 模型以及其他 5 种 VPS-BR 算法中 MB-LBP 方法少,其原因在于提取声能谱图特征
的模型,表现出较明显的性能劣势。这是因为 SVM 时,MBCS-LBP 方法采用邻域多像素灰度均值较
分类器难以适应大于 2 的多分类,而且其 LBP 直方 MB-LBP 采用的单像素灰度方法大幅度降低了计
图操作因二值化隐去了特征细节,因此这两方面因 算量。但分块维度的持续增大并不能换取持续增加
素叠加,导致LBP+SVM组合模型识别率最低。 的识别率。随着分块维度 N 增大,这两种方法所获
为便于对比,设定鸟的种数为 15,将声能谱图 识别率均表现为先逐渐升高后逐渐降低的趋势。而
大小统一调整为 180×180像素,然后依次用N × N 且均在分块维度为 5×5 时,这两种方法的识别率达
分别为 1×1、3×3、5×5、7×7、9×9 的像素块大小进 到各自性能顶点,其中 MBCS-LBP 识别率最大值
行测试。MB-LBP 和 MBCS-LBP 特征提取方法在 92%,比 MB-LBP 方法高出 2.32%。如分块维度大
不同分块情形下的识别性能如图10所示。 于 5×5,则因为谱图微观特征信息出现相对较大的