Page 133 - 《应用声学》2020年第3期
P. 133
第 39 卷 第 3 期 Vol. 39, No. 3
2020 年 5 月 Journal of Applied Acoustics May, 2020
⋄ 研究报告 ⋄
融合声纹信息的能量谱图在鸟类识别中的研究
杨春勇 1,2† 祁宏达 1,2 彭焱秋 1,2 尹 滨 1,2 侯 金 1,2 舒振宇 2 陈少平 2
(1 智能无线通信湖北省重点实验室 武汉 430074)
(2 中南民族大学电子信息工程学院 武汉 430074)
摘要:常用的梅尔倒谱系数结合高斯混合模型 (MFCC+GMM) 方法的鸟鸣声识别技术难适应噪声环境,模型
难以收敛,且计算复杂度高。该文提出一种融合声纹信息的能量谱图的鸟类识别方法 (VPS-BR),该方法利用
鸟类鸣声在能量谱图上所表现的多维差异性,定量识别鸣声声纹特征。通过对分贝能量进行颜色映射得到能
量谱图,提取其视觉特征所表达的声学特征,分析归纳得到鸟类特有鸣声模式。在特征提取步骤中,选用识别
速度快的局部二值模式、识别鲁棒性高的方向梯度直方图两个参数表征鸟鸣声谱图的边缘声纹;在识别步骤
中,用局部二值模式和方向梯度直方图两种特征分别与支持向量机、K 最近邻和随机森林 3 种分类器算法进行
两两组合构建识别模型测试。对 15 种原始带噪鸟类鸣声数据集进行交叉验证,VPS-BR 模型的平均识别率比
MFCC+GMM 组合模型高出 11.3%,方向梯度直方图特征与 K 最近邻分类器的组合模型识别率达 90.5%,表
现出较好的抗噪性能和识别性能。最后针对样本数据集缺乏问题,使用生成对抗网络进行图像增强,进一步将
识别率提升 1.48%。
关键词:鸟类识别;能量谱图;局部二值模式;方向梯度直方图;生成对抗网络
中图法分类号: TP391.04 文献标识码: A 文章编号: 1000-310X(2020)03-0453-11
DOI: 10.11684/j.issn.1000-310X.2020.03.019
Research on the application of energy spectrum with voiceprint information
in bird recognition
YANG Chunyong 1,2 QI Hongda 1,2 PENG Yanqiu 1,2 YIN Bin 1,2
HOU Jin 1,2 SHU Zhenyu 2 CHEN Shaoping 2
(1 Hubei Key Laboratory of Intelligent Wireless Communications, Wuhan 430074, China)
(2 College of Electronics and Information Engineering, South-Central University for Nationalities, Wuhan 430074, China)
Abstract: The bird’s voice recognition technology combined with the Mel-frequency cepstral coefficients and
the Gaussian mixture model (MFCC+GMM) method is difficult to adapt to the noise environment, and its
computational complexity is high. In this paper, a novel bird recognition method using voice-power spectrum
(VPS-BR) to express acoustic features is proposed. It utilizes the multi-dimensional difference of bird sounds on
the power spectrum to quantitatively identify the texture features of the sound. In the feature extraction step,
the edge texture of the bird’s voice-power spectrum is characterized by local binary pattern (LBP) and direction
gradient histogram (HOG); in the identification step, the VPS-BR model is constructed by combining LBP
and HOG with support vector machine, K nearest neighbor (KNN) and random forest. The cross-validation
2019-07-12 收稿; 2019-11-28 定稿
作者简介: 杨春勇 (1975– ), 男, 重庆人, 博士, 教授, 研究方向: 仪器仪表,物联网技术。
† 通信作者 E-mail: cyyang@mail.scuec.edu.cn