Page 139 - 《应用声学》2020年第3期
P. 139

第 39 卷 第 3 期            杨春勇等: 融合声纹信息的能量谱图在鸟类识别中的研究                                          459


                       dB
                    +0
                   -10
                            4096
                   -20
                           ᮠဋ/Hz
                   -30      2048
                   -40
                   -50      1024
                   -60
                            512
                   -70
                   -80                                        8T8            16T16          32T32
                               0    2    4    6    8
                                         ௑ᫎ/s
                                    (a) ԔݽᲞܦ៨ڏ                                             (b) ӭ඀Პܦ៨ڏஊܸ
                                                图 7  不同精度 HOG 特征提取
                                      Fig. 7 HOG feature extraction with different accuracy

                   dB
                 +0
                -10
                -20                                                         1600
                -30                                                         1200
                -40                                                        ೙एግҫϙ  800
                -50                                                          400
                -60                                                           0
                                                                               30
                -70                                                                                    30
                                                                                  20
                                                                                                   20
                -80                                                                y  10  0  0  10  x
                            (a1) ᑟ᧚៨ڏ                                  (a2) HOGྲढ़                                    (a3) HOGʼ፥ڏ
                                                        (a) ກᄹಐᖐ
                   dB
                 +0
                -10                                                          800
                -20                                                          600
                -30                                                         ೙एግҫϙ  400
                -40
                -50                                                          200
                                                                              0
                -60
                                                                                30
                -70                                                                20              20  30
                -80                                                                y  10  0  0  10  x
                            (b1) ᑟ᧚៨ڏ                                  (b2) HOGྲढ़                                  (b3) HOGʼ፥ڏ
                                                         (b) ˗Ө᳍Უ
                   dB
                 +0
                -10
                                                                             800
                -20
                -30                                                          600
                -40                                                         ೙एግҫϙ  400
                -50                                                          200
                -60                                                           0
                -70                                                             30
                                                                                   20                  30
                                                                                                   20
                -80                                                                 y  10      10
                                                                                         0  0     x
                            (c1) ᑟ᧚៨ڏ                                (c2) HOGྲढ़                                     (c3) HOGʼ፥ڏ
                                                       (c) ᔉࡋചᲜ
                                       图 8  淡眉柳莺、中华鹧鸪和花尾榛鸡的 VPS 特征对比
                   Fig. 8 VPS feature contrast between Phylloscopus humei, Francolinus pintadeanus and Bonasa bonasia

             2.3 识别率与识别时间                                      VPS-BR 的性能,对照文献 [5] 所研究的 MFCC 与

                 本文 VPS-BR 算法实现所采用的硬件平台为                       GMM 组合模型,将提取的 LBP、HOG 特征分别与
             TITAN X GPU、8 G 内存,软件环境为 MATLAB                   SVM、KNN、RF分类器算法进行两两组合实验。在
             7.0、Python 3.6 以及相关工具包。为了进一步评估                    实验中,依次选择2 种、5种、10种、15种鸟的鸣声进
   134   135   136   137   138   139   140   141   142   143   144