Page 136 - 《应用声学》2020年第3期
P. 136

456                                                                                  2020 年 5 月


             统计直方图,最后综合所有扫描窗口的统计值,获得                           多像素块 LBP 特征的计算来表达鸟类鸣声声纹特
             MBCS-LBP特征。                                       征。以N × N 的邻域为例,对整幅能量谱图进行计
                 MBCS-LBP 特征采用邻域多像素灰度均值替                       算时,相应的MBCS-LBP特征计算如下:
             换传统单像素灰度         [20] ,进而根据多像素均值步进到
                                                                          MBCS-LBP(N)
                                                                           N/2−1
                                                                            ∑                     j
                           नݽ                                           =       S(x)(B j −B j+N/2 )2 ,    (1)
                                                                            j=0
                     Ԕݽ៨ڏᣁ૱˞༦एڏϸ           Gammaಖюӑ            式 (1) 中,“2 ” 是 LBP 中的卷积运算,其中 B j 表示
                                                                          j
                                                               邻域内第 j 个像素块的灰度均值,计算方法如式 (2)
                         ೝ฾ቔ԰ੳଡ              ᝺ᎶԠ஝
                                                               所示;(B j − B j+N/2 )表示互为中心对称的两个像素
                           ௧աੳ          ௧                      块灰度均值之差;S(x) 为单位阶跃函数,计算方法
                           ଡ߹ඌ              ૃଌᄰவڏ
                                                               如式(3)所示:
                           ա
                                                                                       i
                     ࠲ੳଡڱѬ˞ᔪࣰӭЋಫ              ፇౌ                                      ∑
                                                                                 B j =    g i ,           (2)
                                                                                      i=0
                           ௧ա           ա                                           {
                         ˞తՑʷ˔ӭ              ̄ϙ᧚ӑ                                     1, x > 0,
                           Ћಫ                                                S(x) =                       (3)
                           ௧                                                          0, x < 0,
                     ӭЋಫፒᝠጸՌੇڱፒᝠ             ᤉ҄ᣁ૱
                                                               式 (2) 中,g i 表示第 j 个像素块内第 i 个像素的灰
                        ˗ॷࠫሦፒᝠ              ᄰவڏፒᝠ              度值。
                                                                   MBCS-LBP 特征计算示意图如图 4 所示,在
                       图 3  MBCS-LBP 特征提取流程                    LBP 特征提取步骤上进一步优化,使得编码更短、
                Fig. 3 Flows of MBCS-LBP feature extraction    传输识别速度更快。


                                            g 0  g 1  g 2  g 0  g 1  g 2
                                            75  70  78    0   0  0           ̄ᤉ҄
                                                                     ̄ϙᝠካ
                                            g 7  g c  g 3  g 7  g c  g 3    00011110
                                            79  80  83    0      1           ӡᤉ҄
                                                                               30
                                            g 6  g 5  g 4  g 6  g 5  g 4
                                            85  88  92    1   1  1
                                                         (a) ԔݽLBPྲढ़ଢԩ
                                     ᑟ᧚៨ڏ
                        0
                                                  x
                        -10
                            4096
                        -20                                            82  74  75   1
                        -30  2048                                                               1011
                        -40  ᮠဋ/Hz                                     76    78     0
                        -50  1024
                                                                       84  86  77   1  1
                        -60
                             512
                        -70
                        -80
                                0 1 2 3 4 5 6 7 8
                               y
                                      ௑ᫎ/s
                                                     (b) ஈᤉᄊMBCS-LBPྲढ़ଢԩ
                                               图 4  MBCS-LBP 特征提取示意图
                                         Fig. 4 Diagram of MBCS-LBP feature extraction
             1.3 HOG特征提取                                       HOG特征。在预处理环节,首先对从原始鸣声谱图
                                                               转换得到的灰度图像进行 Gamma 标准化,然后设
                 由文献 [21],HOG特征提取示意图如图 5所示。
                                                               置步长、扫描窗口大小等参数,最后启动 HOG 特征
             生成的 VPS 分别经由灰度图像转换、Gamma 标准                       提取。在扫描步骤中,对每一个扫描窗口中的单元
             化、单元格梯度计算、空间直方图计算、累加直方图                           格进行梯度计算,并将不同权重的梯度信息进行累
             投影、对比度标准化与块向量拼接步骤生成相应的                            加直方图投影,然后将所有单元格在像素块上再次
   131   132   133   134   135   136   137   138   139   140   141