Page 135 - 《应用声学》2023年第3期
P. 135

第 42 卷 第 3 期 梁基重等: 基于卷积神经网络的气体绝缘组合开关盆式绝缘子螺栓松动检测方法                                           573


                                                               到最优;lr 选取过低虽然有助于神经网络收敛到全
             4.2 lr对模型性能的影响                                    局最优解,但是训练速度会严重降低。因此,一般在
                 lr选择不当一方面会造成神经网络学习速度过                         训练前期,会设置一个较大的lr进行训练,一方面能

             慢,严重时会停止学习;另一方面,会使神经网络学                           够有效加快训练速度,另一方面使得模型更容易收
             习到错误的特征量而陷入局部最优解。lr选取过高,                          敛。本节通过改变不同的lr,研究lr对训练准确率和
             会使训练过程跳过有用的特征量,使准确率无法达                            损失值的影响。训练结果曲线如图7所示。

                                                   loss                                      loss
                                                   acc            2.0                        acc
                        2.0
                                                   val_loss                                  val_loss
                                                   val_acc                                   val_acc
                        1.5                                       1.5
                       ஝ϙ  1.0                                   ஝ϙ  1.0


                        0.5                                       0.5

                          0                                        0
                            0   50   100  150  200  250  300         0    50  100  150  200  250  300
                                        ᤖ̽൓஝                                     ᤖ̽൓஝
                                      (a) lr=0.05                              (b) lr=0.01
                                                   loss
                        2.0                        acc            2.0
                                                   val_loss
                                                   val_acc
                        1.5
                                                                  1.5
                       ஝ϙ  1.0                                   ஝ϙ         loss
                                                                            acc
                                                                  1.0       val_loss
                                                                            val_acc
                        0.5
                                                                  0.5
                          0
                            0   50   100  150  200  250  300         0    50  100  150  200  250  300
                                        ᤖ̽൓஝                                     ᤖ̽൓஝
                                      (c) lr=0.001                            (d) lr=0.00001
                                                    图 7  lr 对 CNN 的影响
                                                Fig. 7 The effect of lr on CNN
                 表4为不同lr对CNN的影响。由实验结果可以                        4.3  训练数据类型对模型性能的影响
             看到,当lr 为 0.05 时,模型出现无法拟合的情况,说                         通过超声信号仪测量到的数据包括声程、幅度、
             明此时lr设置过大;当把lr从0.01一直下降到0.001                     正半波、副半波等指标:声程表示超声波从发射端到
             时,模型过拟合情况逐渐消失,并且在lr 为0.001 时,                     接收端传播的距离;幅度表示 RF 射频信号的幅值,
             模型损失值几乎降为 0,说明此时神经网络预测效                           是超声信号经过仪器放大器放大后进行处理的波
             果达到最佳。当继续增大 lr 时,发现模型继续出现                         形;正半波表示高于闸门的超声信号,负半波表示低
             损失值上下浮动的情况,当 lr 减小到 0.00001 时,模                   于闸门的超声信号。本节研究不同训练数据对模型
             型准确率开始出现下降的情况,说明需要迭代更多                            的影响。迭代次数均设置为 320 次,lr 设置为 0.001,
             次数来达到较高的准确率。                                      训练结果如表5所示。

                         表 4   lr 对 CNN 的影响                        由表5可以看出,当输入全部特征量时,训练准
                   Table 4 The impact of lr on CNN             确率达到 100%,损失值降到最低,但是训练时间相
                                                               对较长,而输入单一特征量时,训练准确率有所下
                 lr    0.05  0.01  0.005  0.001  0.0001 0.00001
                                                               降,并且损失值相对较高,但是训练速度较快。当仅
              准确率/%    53.41  87.29  97.04  100  100  52.64
                                                               输入声程时,模型无法训练,说明当螺栓松动情况发
               损失值    2.8641 0.8529 0.0073 0.0008 0.0792  1.7245
                                                               生变化时,并不会引起超声传播声程的变化。
   130   131   132   133   134   135   136   137   138   139   140