Page 140 - 《应用声学》2020年第3期
P. 140

460                                                                                  2020 年 5 月


             行特征提取与种数识别。为便于比较,各算法按照
                                                                     100
             识别率从低到高的顺序依次列于表1。
                                                                      90                           86.21%
                            表 1   识别率对比
                                                                    គѿဋ/%
              Table 1 Comparison table of recognition rate            80
                                                (单位: %)
                    识别率         2 种   5 种   10 种   15 种               70    MFCC+GMM
                                                                            LBP+SVM
                                                                            LBP+KNN
                  LBP+SVM        94   79.4   70.2   74.8              60    LBP+RF
                                                                            HOG+SVM
                MFCC+GMM   [5]  95.5  80.6   78.6   69.6                    HOG+KNN
                                                                            HOG+RF
                                                                      50
                   LBP+RF        95   86.4   80.4   74                  0   2  4   6   8   10  12  14  16
                   HOG+RF       98.5   91    90.2   88.8                             Ლዝመ஝
                  LBP+KNN       100    93    88.6   83                            (a) គѿဋࠫඋڏ
                  HOG+SVM       100   95.6   89.7   86.8
                  HOG+KNN       100   97.4   93.8   90.5
                                                                     100
                 观察并分析表1 中的数据,VPS-BR算法下的6
                                                                      90
             种组合模型平均识别率为 80.9%,较MFCC+GMM
             组合模型高出 11.3%,证明 VPS-BR识别算法(即从                          គѿဋ/%  80
             VPS提取LBP与HOG两类特征,再与SVM、KNN、                              70
             RF 三种分类器两两组合) 比 MFCC+GMM 的组合
                                                                      60
             模型具有更高的识别率。其主要原因是鸟鸣声一维
                                                                      50
             波形信号被转换为二维能量谱图,通过增加维度引
                                                                          B   C    D    E   F    G    H
             入更多高性能的多特征提取及识别算法对识别增                                                   LBP+RF
             益有直接贡献。为更好地比较不同模型的识别性                                   FCC+GMM LBP+SVM LBP+KNN  HOG+SVM HOG+KNN HOG+RF
             能,再将表 1 中的 7 种模型对 2 种 ∼ 15 种鸟类的识                                        ጸՌവی
                                                                                  (b) គѿဋኸጳڏ
             别情况示于图9。
                                                                  图 9  MFCC+GMM 模型与 VPS-BR 算法各模型
                 如图 9(a) 所示,尽管每一波形样本所含噪声不
                                                                  识别性能对比
             尽相同,各模型识别变化趋势也略有波动,但总体
                                                                  Fig. 9  Comparison of recognition performance
             看,随着识别种数增加,这7 种模型的识别率均逐渐                             between MFCC+GMM model and VPS-BR algo-
             减小,而且图 9(b) 箱线图显示 VPS-BR 算法各模型                       rithm
             识别率比较稳定,多数优于MFCC+GMM。还可看
             出,在种数较少情况下,SVM和KNN分类器性能表                              由图 10 可以看出,随着分块维度 N 增加,识别
             现较好;在种数较多情况下,KNN 分类器性能仍然                          耗时均逐渐减少。相比于前文提到的 HOG+KNN
             较为突出,RF 分类器识别率略高于 MFCC+GMM                        模型,识别耗时缩短了 91.1%。对于相同分块维
             组合模型。图 9 中还显示 LBP+SVM 组合模型较                       度,采用 MBCS-LBP 方法在识别时间上的开销比
             MFCC+GMM 模型以及其他 5 种 VPS-BR 算法中                    MB-LBP 方法少,其原因在于提取声能谱图特征
             的模型,表现出较明显的性能劣势。这是因为 SVM                          时,MBCS-LBP 方法采用邻域多像素灰度均值较
             分类器难以适应大于 2 的多分类,而且其 LBP 直方                       MB-LBP 采用的单像素灰度方法大幅度降低了计
             图操作因二值化隐去了特征细节,因此这两方面因                            算量。但分块维度的持续增大并不能换取持续增加
             素叠加,导致LBP+SVM组合模型识别率最低。                           的识别率。随着分块维度 N 增大,这两种方法所获
                 为便于对比,设定鸟的种数为 15,将声能谱图                        识别率均表现为先逐渐升高后逐渐降低的趋势。而

             大小统一调整为 180×180像素,然后依次用N × N                      且均在分块维度为 5×5 时,这两种方法的识别率达
             分别为 1×1、3×3、5×5、7×7、9×9 的像素块大小进                   到各自性能顶点,其中 MBCS-LBP 识别率最大值
             行测试。MB-LBP 和 MBCS-LBP 特征提取方法在                     92%,比 MB-LBP 方法高出 2.32%。如分块维度大
             不同分块情形下的识别性能如图10所示。                               于 5×5,则因为谱图微观特征信息出现相对较大的
   135   136   137   138   139   140   141   142   143   144   145