Page 68 - 《应用声学)》2023年第5期
P. 68

960                                                                                  2023 年 9 月


                                                               第5 种泄漏样本更多分至第3种泄漏等级。同时,样
                 100
                  90
                                                               本集得越多,分配越明显。因此,本文提出的方法在
                  80
                                          ᄾࠄ200                考虑实际工况无明显界限时,实验结果基本符合理
                  70                      ᄾࠄ200+ၷੇ200          论分析,验证了方法的性能和适用性。
                Ѭዝюᆸဋ/%  50               ᄾࠄ200+ၷੇ600             表 3   第 5 种泄漏工况下,不同训练数据集之间
                                          ᄾࠄ200+ၷੇ400
                  60
                                          ᄾࠄ200+ၷੇ800
                                          ᄾࠄ200+ၷੇ1000
                  40
                  30                      ၷੇ200                   CNN 模型的分类结果
                                          ၷੇ400
                  20                      ၷੇ600                   Table 3 Classification results of the CNN
                                          ၷੇ800
                  10                                              model among different training data sets
                                          ၷੇ1000
                   0                                              under the fifth leak condition
                    0     20     40     60     80    100
                                  ᤖ̽൓஝
                                                                      不同训练集        泄漏 1  泄漏 2   泄漏 3  泄漏 4
               图 7  不同训练数据集之间的泄漏检测模型分类性能                               真实 200        0     3     85    12
              Fig. 7 Classification performance of leak detection   真实 200+ 生成 200    0     1     87    12
              model among different training data sets              真实 200+ 生成 400    0     2     88    10
                                                                   真实 200+ 生成 600    0     0     90    10
                表 2  使用真实数据和生成数据的不同训练数据
                                                                   真实 200+ 生成 800    0     0     91     9
                集及分类结果
                                                                  真实 200+ 生成 1000    0     0     91     9
                Table 2  Different training data sets us-
                                                                       生成 200        1     5     76    18
                ing real data and generated data and the
                                                                       生成 400        1     3     80    16
                classification results
                                                                       生成 600        1     2     82    15
                 序号      真实数据      生成数据       分类精度/%                   生成 800        0     1     87    12
                  1       200         0           96                  生成 1000        0     0     90    10
                  2       200        200          97
                                                                   进一步,为了验证数据驱动的 CNN 的分类优
                  3       200        400        97.75
                                                               势,开展了基于 SVM 的分类检测模型的构建。在
                  4       200        600        98.25
                                                               此,选择文献 [5] 提到的管道泄漏常用的参数作为
                  5       200        800        99.75
                                                               特征,其中时域特征为标准差、均方根、能量,频域
                  6       200        1000        100
                                                               参数为平均频率、特征频带包络面积。同时,考虑
                  7        0         200          94
                                                               到高斯径向基 (RBF) 核函数 (KG)具有相对简单的
                  8        0         400        96.75
                                                               计算形式、输入参数较少、更强的学习能力                     [18] ,选
                  9        0         600         97.5
                                                               择 RBF 作为分类预测核函数。整个训练测试过程,
                  10       0         800          98
                                                               训练集与测试集比例 2 : 1,总特征集包含 1200 样
                  11       0         1000        99.5
                                                               本,分类结果如表 4 所示。此处,F1 表示时域参数
                 同时,考虑到实际中的工况其实并不存在明显                          特征组合集,F2 表示频域参数特征组合集,F3 表示
             的界限,为验证所提出方法的性能或适用性,选取了                           77 ∼ 87 kHz 特征频带包络面积特征,F4 表示频域
             不同于前 4 种泄漏等级的第 5 种泄漏工况,泄漏率                        参数和时域参数的组合特征集。
             为2.5 mL/s,用于测试上述训练模型。理论上,由于                           由表 4 可以看出,时域和频域特征的组合能够
             在训练时指定了 4 种泄漏工况,出现的第 5 种泄漏                        提升泄漏检测精度,而实际主要优势在于特征频带
             工况将被模型分配至4种工况。相应地,按照本文选                           包络面积的选择。可见,特征的提取和选择对最终
             取的 2.5 mL/s 泄漏率,本文的第 5 种泄漏样本会更                    的结果影响巨大。对比构建的不同分类测试模型
             多划分至第 3种和第 4种泄漏工况,其中第3种应该                         结果发现,通过选择合适的特征指标,SVM 分类精
             居多,或者全部分配至第 3 种。本文选取了不同数                          度在某种程度上可以媲美 CNN 结果,精度已达到
             据样本训练的CNN模型,测试样本为100,第5种泄                         98.75%。但是,该模型的精度需要依靠人为特征提
             漏工况的分类预测结果如表 3 所示。由表 3 可发现,                       取过程的保证。
   63   64   65   66   67   68   69   70   71   72   73