Page 99 - 《应用声学》2025年第2期
P. 99

第 44 卷 第 2 期          申小虎等: 网络剪枝与知识蒸馏相结合的轻量级鸟声识别方法                                          359


                 由表 5 发现,在取消稀疏校准系数与内部蒸馏                           表 6   EfficientNet-B0 微调网络与主流基准网
             损失分量的操作后,轻量级网络在相同参数量条件                               络性能对比
                                                                  Table 6 Performance comparison between
             下均产生了不同程度的性能下降,这是由通道剪枝
                                                                  EfficientNet-B0 fine-tuned network and
             的随机性与模块间特征映射信息缺失所造成。本节
                                                                  state-of-the-art network
             实验结果支持本文所提出的稀疏校准系数与内部
             蒸馏损失分量在提升轻量级模型鸟类识别精度上                              网络模型                参数量/M FLOPs/M c-mAP/%
             的结论。                                               EfficientNet-B0-Tuning1  3.0    209      91.64
                                                                SqueezeNet            4.8     391     92.18
                 表 5  EfficientNet-B0 切割前后的性能对比                   MobileNet-V2          3.5     300      90.79
              Table 5 Performance comparison of Efficient-        TinyNet-B             3.9     312      91.43
              Net-B0 before and after cutting
                                                                ShuffleNet-V2 1.5×      3.5     299      89.98
                                                                EfficientNet-B0-Tuning2  2.2    157     82.91
                     切割方法             c-mAP/%    参数量/M
                                                                MobileNet-V2 0.5×     2.0      97      80.60
                EfficientNet-B0-Tuning1  91.64       3.0
                                                                TinyNet-C             2.5     100      81.57
                   Pruning1-SCC        70.14       3.0
                                                                EfficientNet-B0-Tuning3  1.5     96      64.38
                    Tuning1-IDL        86.78       3.0
                                                                MobileNet-V1          1.3     110      66.05
             3.5 与其他主流轻量级网络的对比                                  ShuffleNet-V2 0.5×      1.4      41      61.43
                                                                LDFSRE-NET            0.9      35     70.84
             3.5.1 在服务器平台上的对比结果
                 随着深度学习方法在图像识别和目标识别                            3.5.2 在边缘设备平台上的对比结果
             领 域 的 成 功 应 用, 很 多 研 究 者 将 经 典 深 度 网
                                                                   此外,本文在龙芯 2K1000LA 边缘设备开发板
             络引入到鸟声自动识别领域。除前述的轻量级                              上对本文微调后的 Tuning级网络进行了性能对比。
             网络 KD-CLDNN(97.6 M)、LDFSRE-NET(0.9 M)             龙芯2K1000LA兼具高性能、低功耗、高可靠性等特
             外,著名的经典轻量级网络还包括 SqueezeNet                [31] 、  点,适用于包括声学监测和语声识别在内的多种应
             TinyNet [32] 、MobileNet [33−34] 、ShuffleNet [35]  等,并  用场景,其具体参数如表7所示。
             在近年发展出许多升级版本。为了对比,选择与本
                                                                        表 7   龙芯 2K1000LA 参数细节
             文模型规模相近的网络,并用相同数据集进行了训
                                                                  Table 7    The detailed information of
             练。鸟声识别测试的结果如表6所示。
                                                                  2K1000LA
                 从统计结果来看,本文方法得到的 Efficient-
             Net-B0 各规模压缩模型与其他模型相比均获得                                   测试环境                 参数内容
             了较好的分类性能,展现了较强的可伸缩性。例                                       架构                 Loongarch
             如,EfficientNet-B0-Tuning2 在参数和计算效率相                           系统                 Loongnix

             似的情况下,其平均识别精度比 TinyNet-C 提高了                                CPU             LS2K1000LAi 1G
                                                                         内存                4 GB DDR3
             1.34%。尽管 EfficientNet-B0-Tuning1 网络在平均
                                                                        峰值速度                 8GFlops
             识别精度上没有取得最佳成绩,但网络参数量与计
                                                                        功耗范围                 1∼5 W
             算量均小于获得最佳精度成绩的SqueezeNet 网络。
                                                                      动态降频降压                  支持
             而EfficientNet-B0-Tuning3网络表现性能则略低于
             近似规模的 MobileNet-V1 与 LDFSRE-NET,这说                    本节实验选择自建数据集中的10种鸟类,每种
             明本文方法在压缩规模存在一定的限制。与规模相                            鸟类100份样本,共1000份鸟声片段(5 s)进行推理
             近网络相比,LDFSRE-NET 在最小参数量下获得                        测试,计算得到的平均推理时间如表8所示。
             最佳c-mAP精度,这可能得益于双特征融合算法更                              剪枝微调后的到的 Tuning 级网络随着参数量
             全面地提取了鸟声特征,为下一步研究方向指明了                            的下降,推理时间也得到相应减少,分别下降了为
             方向。                                               41.5%、53.7%与68.3%。实验结果表明,本文方法构
   94   95   96   97   98   99   100   101   102   103   104