Page 68 - 《应用声学)》2023年第5期
P. 68
960 2023 年 9 月
第5 种泄漏样本更多分至第3种泄漏等级。同时,样
100
90
本集得越多,分配越明显。因此,本文提出的方法在
80
ᄾࠄ200 考虑实际工况无明显界限时,实验结果基本符合理
70 ᄾࠄ200+ၷੇ200 论分析,验证了方法的性能和适用性。
Ѭዝюᆸဋ/% 50 ᄾࠄ200+ၷੇ600 表 3 第 5 种泄漏工况下,不同训练数据集之间
ᄾࠄ200+ၷੇ400
60
ᄾࠄ200+ၷੇ800
ᄾࠄ200+ၷੇ1000
40
30 ၷੇ200 CNN 模型的分类结果
ၷੇ400
20 ၷੇ600 Table 3 Classification results of the CNN
ၷੇ800
10 model among different training data sets
ၷੇ1000
0 under the fifth leak condition
0 20 40 60 80 100
ᤖ̽
不同训练集 泄漏 1 泄漏 2 泄漏 3 泄漏 4
图 7 不同训练数据集之间的泄漏检测模型分类性能 真实 200 0 3 85 12
Fig. 7 Classification performance of leak detection 真实 200+ 生成 200 0 1 87 12
model among different training data sets 真实 200+ 生成 400 0 2 88 10
真实 200+ 生成 600 0 0 90 10
表 2 使用真实数据和生成数据的不同训练数据
真实 200+ 生成 800 0 0 91 9
集及分类结果
真实 200+ 生成 1000 0 0 91 9
Table 2 Different training data sets us-
生成 200 1 5 76 18
ing real data and generated data and the
生成 400 1 3 80 16
classification results
生成 600 1 2 82 15
序号 真实数据 生成数据 分类精度/% 生成 800 0 1 87 12
1 200 0 96 生成 1000 0 0 90 10
2 200 200 97
进一步,为了验证数据驱动的 CNN 的分类优
3 200 400 97.75
势,开展了基于 SVM 的分类检测模型的构建。在
4 200 600 98.25
此,选择文献 [5] 提到的管道泄漏常用的参数作为
5 200 800 99.75
特征,其中时域特征为标准差、均方根、能量,频域
6 200 1000 100
参数为平均频率、特征频带包络面积。同时,考虑
7 0 200 94
到高斯径向基 (RBF) 核函数 (KG)具有相对简单的
8 0 400 96.75
计算形式、输入参数较少、更强的学习能力 [18] ,选
9 0 600 97.5
择 RBF 作为分类预测核函数。整个训练测试过程,
10 0 800 98
训练集与测试集比例 2 : 1,总特征集包含 1200 样
11 0 1000 99.5
本,分类结果如表 4 所示。此处,F1 表示时域参数
同时,考虑到实际中的工况其实并不存在明显 特征组合集,F2 表示频域参数特征组合集,F3 表示
的界限,为验证所提出方法的性能或适用性,选取了 77 ∼ 87 kHz 特征频带包络面积特征,F4 表示频域
不同于前 4 种泄漏等级的第 5 种泄漏工况,泄漏率 参数和时域参数的组合特征集。
为2.5 mL/s,用于测试上述训练模型。理论上,由于 由表 4 可以看出,时域和频域特征的组合能够
在训练时指定了 4 种泄漏工况,出现的第 5 种泄漏 提升泄漏检测精度,而实际主要优势在于特征频带
工况将被模型分配至4种工况。相应地,按照本文选 包络面积的选择。可见,特征的提取和选择对最终
取的 2.5 mL/s 泄漏率,本文的第 5 种泄漏样本会更 的结果影响巨大。对比构建的不同分类测试模型
多划分至第 3种和第 4种泄漏工况,其中第3种应该 结果发现,通过选择合适的特征指标,SVM 分类精
居多,或者全部分配至第 3 种。本文选取了不同数 度在某种程度上可以媲美 CNN 结果,精度已达到
据样本训练的CNN模型,测试样本为100,第5种泄 98.75%。但是,该模型的精度需要依靠人为特征提
漏工况的分类预测结果如表 3 所示。由表 3 可发现, 取过程的保证。