Page 136 - 《应用声学》2020年第3期
P. 136
456 2020 年 5 月
统计直方图,最后综合所有扫描窗口的统计值,获得 多像素块 LBP 特征的计算来表达鸟类鸣声声纹特
MBCS-LBP特征。 征。以N × N 的邻域为例,对整幅能量谱图进行计
MBCS-LBP 特征采用邻域多像素灰度均值替 算时,相应的MBCS-LBP特征计算如下:
换传统单像素灰度 [20] ,进而根据多像素均值步进到
MBCS-LBP(N)
N/2−1
∑ j
नݽ = S(x)(B j −B j+N/2 )2 , (1)
j=0
Ԕݽ៨ڏᣁ૱˞༦एڏϸ Gammaಖюӑ 式 (1) 中,“2 ” 是 LBP 中的卷积运算,其中 B j 表示
j
邻域内第 j 个像素块的灰度均值,计算方法如式 (2)
ೝቔੳଡ ᎶԠ
所示;(B j − B j+N/2 )表示互为中心对称的两个像素
௧աੳ ௧ 块灰度均值之差;S(x) 为单位阶跃函数,计算方法
ଡ߹ඌ ૃଌᄰவڏ
如式(3)所示:
ա
i
࠲ੳଡڱѬ˞ᔪࣰӭЋಫ ፇౌ ∑
B j = g i , (2)
i=0
௧ա ա {
˞తՑʷ˔ӭ ̄ϙ᧚ӑ 1, x > 0,
Ћಫ S(x) = (3)
௧ 0, x < 0,
ӭЋಫፒᝠጸՌੇڱፒᝠ ᤉ҄ᣁ૱
式 (2) 中,g i 表示第 j 个像素块内第 i 个像素的灰
˗ॷࠫሦፒᝠ ᄰவڏፒᝠ 度值。
MBCS-LBP 特征计算示意图如图 4 所示,在
图 3 MBCS-LBP 特征提取流程 LBP 特征提取步骤上进一步优化,使得编码更短、
Fig. 3 Flows of MBCS-LBP feature extraction 传输识别速度更快。
g 0 g 1 g 2 g 0 g 1 g 2
75 70 78 0 0 0 ̄ᤉ҄
̄ϙᝠካ
g 7 g c g 3 g 7 g c g 3 00011110
79 80 83 0 1 ӡᤉ҄
30
g 6 g 5 g 4 g 6 g 5 g 4
85 88 92 1 1 1
(a) ԔݽLBPྲढ़ଢԩ
ᑟ᧚៨ڏ
0
x
-10
4096
-20 82 74 75 1
-30 2048 1011
-40 ᮠဋ/Hz 76 78 0
-50 1024
84 86 77 1 1
-60
512
-70
-80
0 1 2 3 4 5 6 7 8
y
ᫎ/s
(b) ஈᤉᄊMBCS-LBPྲढ़ଢԩ
图 4 MBCS-LBP 特征提取示意图
Fig. 4 Diagram of MBCS-LBP feature extraction
1.3 HOG特征提取 HOG特征。在预处理环节,首先对从原始鸣声谱图
转换得到的灰度图像进行 Gamma 标准化,然后设
由文献 [21],HOG特征提取示意图如图 5所示。
置步长、扫描窗口大小等参数,最后启动 HOG 特征
生成的 VPS 分别经由灰度图像转换、Gamma 标准 提取。在扫描步骤中,对每一个扫描窗口中的单元
化、单元格梯度计算、空间直方图计算、累加直方图 格进行梯度计算,并将不同权重的梯度信息进行累
投影、对比度标准化与块向量拼接步骤生成相应的 加直方图投影,然后将所有单元格在像素块上再次