试集,可以有效地防止过拟合造成的识别率虚高情 可以进一步提高,后续工作将进一步研究如何在整
况。依次选择2种、3种、4种、5种鸟的鸣声进行特征 个模型网络中引入鸟类相关先验知识。本文可为鸟
提取与种数识别。为便于比较,各算法按照识别率 类识别与保护、湿地生态环境监测和动物行为学研
从低到高的顺序依次列于表2。 究等领域提供应用方法上的理论参考,也为计算机
表 2 识别率对比
Table 2 Comparison table of recognition
参 考 文 献
(单位: %)
LBP+KNN 100 98.3 96.25 95
观察并分析表 2 中的数据,在 5 种鸟类鸣声数
据参与识别的情况下,原始 VPS-BR 算法下的 6 种
组合模型平均识别率为 90.47%,而加入 GAN 生成
的图片之后,VPS-BR 算法的识别率为 91.95%,比
之原来提升 1.48%。其主要原因一是可用于训练和
合出原有鸟类语音的信息,对训练和识别过程起到
正向作用,表明 GAN 网络确实起到了数据增强的
效果。
4 结论
针对鸟鸣声识别的容噪性能差、高复杂度及收
敛困难问题,提出一种融合声纹信息的能量谱图鸟
类识别方法 (VPS-BR),通过描述鸟类鸣声特征谱
图的声纹特征并进行分类识别。通过 LBP 和 HOG
特征分别与 SVM、KNN、RF 分类器算法两两组合
情况下,最高识别率可达 92%,验证了 VPS-BR 方
法兼具良好的容噪性能与识别鲁棒性,且易于收敛。
同时表明 VPS-BR 方法不仅对噪声环境有较强的
法识别鸣声的初步尝试,而基于深度学习以及多种 [10] 郑光美. 鸟类学 [M]. 北京: 北京师范大学出版社, 2012.
