Page 131 - 《应用声学》2024年第1期
P. 131
第 43 卷 第 1 期 张寒等: 声纹信号 -图形差分场增强和多头自注意力机制的变压器工作状态辨识方法 127
10000 10000
8000 8000
ᮠဋ/Hz 6000 ᮠဋ/Hz 6000
4000
4000
2000 2000
0 0
0 0.2 0.4 0.6 0.8 1.0 0 0.2 0.4 0.6 0.8 1.0
ᫎ/s ᫎ/s
(a) ࿄গ (b) ፉጸү
10000 10000
8000 8000
ᮠဋ/Hz 6000 ᮠဋ/Hz 6000
4000
4000
2000 2000
0 0
0 0.2 0.4 0.6 0.8 1.0 0 0.2 0.4 0.6 0.8 1.0
ᫎ/s ᫎ/s
(c) ᨡᔇү (d) ᄱᫎஊႃ
图 10 变压器 4 种状态时频图像
Fig. 10 Time-frequency images of four states of transformer
表 3 神经网络结构参数设计 上述辨识度不高的时频图像集作为原始分类集的
Table 3 Structural parameter design of 输入,因此 4 种状态的辨识精度相较于所提方法均
neural network 存在较大的劣势,最大精度差异达到了 14%;而对
比方法 2 由于引入了区分度明显的 MDF 图像集,4
模型名称 模型结构 参数设置 输出尺寸
种状态的辨识精度均得到了一定幅度的提升,但仍
卷积核大小: 7×7;
卷积层 112×112×64 要低于所提方法,这是因为基于多头注意力机制的
卷积核数量: 64
批量归一化层 112×112×64 Vision Transformer具有更深层次的特征表示能力,
激活函数层 112×112×64 可通过堆叠多个编码器层来提取更高级别的抽象
ResNet- 特征,能够更好地感知图像深层信息特征,从而提高
最大池化层 池化核大小: 3 × 3 56×56×64
CNN
残差块 56×56×64 分类的精度。
残差块 56×56×64
表 4 3 种对比方法的识别精度
全局平均池化层 1×1×64
Table 4 Identification accuracy of three
全连接层 激活函数: SoftMax 4
comparison methods
表 4 为所提方法、对比方法 1 和对比方法 2 共 (单位: %)
计3种方法的识别精度。结合图 10可知,仅图 10(d)
标签
的放电时频图像存在较为显著的区别,而铁芯松动 方法 平均值
1 2 3 4
与绕组松动时频图像存在相似度,这是因为绕组松
所提方法 100.00 97.96 94.23 100.00 98.05
动与铁芯松动两种异常状态下的频谱能量分布皆
对比方法 1 86.00 86.27 82.00 95.92 87.55
集中在频率 f = 1 kHz 的低频段,不利于神经网络
对比方法 2 95.92 88.46 91.67 98.00 93.51
的深度学习与特征的有效感知。综上,由于引入了