Page 135 - 《应用声学》2023年第3期
P. 135
第 42 卷 第 3 期 梁基重等: 基于卷积神经网络的气体绝缘组合开关盆式绝缘子螺栓松动检测方法 573
到最优;lr 选取过低虽然有助于神经网络收敛到全
4.2 lr对模型性能的影响 局最优解,但是训练速度会严重降低。因此,一般在
lr选择不当一方面会造成神经网络学习速度过 训练前期,会设置一个较大的lr进行训练,一方面能
慢,严重时会停止学习;另一方面,会使神经网络学 够有效加快训练速度,另一方面使得模型更容易收
习到错误的特征量而陷入局部最优解。lr选取过高, 敛。本节通过改变不同的lr,研究lr对训练准确率和
会使训练过程跳过有用的特征量,使准确率无法达 损失值的影响。训练结果曲线如图7所示。
loss loss
acc 2.0 acc
2.0
val_loss val_loss
val_acc val_acc
1.5 1.5
ϙ 1.0 ϙ 1.0
0.5 0.5
0 0
0 50 100 150 200 250 300 0 50 100 150 200 250 300
ᤖ̽ ᤖ̽
(a) lr=0.05 (b) lr=0.01
loss
2.0 acc 2.0
val_loss
val_acc
1.5
1.5
ϙ 1.0 ϙ loss
acc
1.0 val_loss
val_acc
0.5
0.5
0
0 50 100 150 200 250 300 0 50 100 150 200 250 300
ᤖ̽ ᤖ̽
(c) lr=0.001 (d) lr=0.00001
图 7 lr 对 CNN 的影响
Fig. 7 The effect of lr on CNN
表4为不同lr对CNN的影响。由实验结果可以 4.3 训练数据类型对模型性能的影响
看到,当lr 为 0.05 时,模型出现无法拟合的情况,说 通过超声信号仪测量到的数据包括声程、幅度、
明此时lr设置过大;当把lr从0.01一直下降到0.001 正半波、副半波等指标:声程表示超声波从发射端到
时,模型过拟合情况逐渐消失,并且在lr 为0.001 时, 接收端传播的距离;幅度表示 RF 射频信号的幅值,
模型损失值几乎降为 0,说明此时神经网络预测效 是超声信号经过仪器放大器放大后进行处理的波
果达到最佳。当继续增大 lr 时,发现模型继续出现 形;正半波表示高于闸门的超声信号,负半波表示低
损失值上下浮动的情况,当 lr 减小到 0.00001 时,模 于闸门的超声信号。本节研究不同训练数据对模型
型准确率开始出现下降的情况,说明需要迭代更多 的影响。迭代次数均设置为 320 次,lr 设置为 0.001,
次数来达到较高的准确率。 训练结果如表5所示。
表 4 lr 对 CNN 的影响 由表5可以看出,当输入全部特征量时,训练准
Table 4 The impact of lr on CNN 确率达到 100%,损失值降到最低,但是训练时间相
对较长,而输入单一特征量时,训练准确率有所下
lr 0.05 0.01 0.005 0.001 0.0001 0.00001
降,并且损失值相对较高,但是训练速度较快。当仅
准确率/% 53.41 87.29 97.04 100 100 52.64
输入声程时,模型无法训练,说明当螺栓松动情况发
损失值 2.8641 0.8529 0.0073 0.0008 0.0792 1.7245
生变化时,并不会引起超声传播声程的变化。