Page 139 - 《应用声学》2020年第3期
P. 139
第 39 卷 第 3 期 杨春勇等: 融合声纹信息的能量谱图在鸟类识别中的研究 459
dB
+0
-10
4096
-20
ᮠဋ/Hz
-30 2048
-40
-50 1024
-60
512
-70
-80 8T8 16T16 32T32
0 2 4 6 8
ᫎ/s
(a) ԔݽᲞܦ៨ڏ (b) ӭᲞܦ៨ڏஊܸ
图 7 不同精度 HOG 特征提取
Fig. 7 HOG feature extraction with different accuracy
dB
+0
-10
-20 1600
-30 1200
-40 एግҫϙ 800
-50 400
-60 0
30
-70 30
20
20
-80 y 10 0 0 10 x
(a1) ᑟ᧚៨ڏ (a2) HOGྲढ़ (a3) HOGʼ፥ڏ
(a) ກᄹಐᖐ
dB
+0
-10 800
-20 600
-30 एግҫϙ 400
-40
-50 200
0
-60
30
-70 20 20 30
-80 y 10 0 0 10 x
(b1) ᑟ᧚៨ڏ (b2) HOGྲढ़ (b3) HOGʼ፥ڏ
(b) ˗ӨᲣ
dB
+0
-10
800
-20
-30 600
-40 एግҫϙ 400
-50 200
-60 0
-70 30
20 30
20
-80 y 10 10
0 0 x
(c1) ᑟ᧚៨ڏ (c2) HOGྲढ़ (c3) HOGʼ፥ڏ
(c) ᔉࡋചᲜ
图 8 淡眉柳莺、中华鹧鸪和花尾榛鸡的 VPS 特征对比
Fig. 8 VPS feature contrast between Phylloscopus humei, Francolinus pintadeanus and Bonasa bonasia
2.3 识别率与识别时间 VPS-BR 的性能,对照文献 [5] 所研究的 MFCC 与
本文 VPS-BR 算法实现所采用的硬件平台为 GMM 组合模型,将提取的 LBP、HOG 特征分别与
TITAN X GPU、8 G 内存,软件环境为 MATLAB SVM、KNN、RF分类器算法进行两两组合实验。在
7.0、Python 3.6 以及相关工具包。为了进一步评估 实验中,依次选择2 种、5种、10种、15种鸟的鸣声进