Page 21 - 《应用声学)》2023年第5期
P. 21

第 42 卷 第 5 期         张皓宇等: 基于超声射频信号的支持向量机双参量 B 线识别方法                                        913


             合,以及识别效果最差的两个参数 (偏度和能量) 组                         参数识别效果较差的特征参数的识别效果。当组成
             成一组双特征参数组合,将上述 4 个特征参数组合                          双特征参数组合的两个特征参数的单参数识别效
             输入非线性 SVM 进行分类,本研究使用的 SVM 基                       果均较好时,比如信息熵加排列熵组合,其双参数
             于 MATLAB 中 LibSVM 工具箱,采用高斯径向核                     SVM 对 B 线的识别效果显著优于其单独的识别效
             函数。                                               果。同时,当组成双特征参数组合的两个特征参数
                 不同参数组合如下:组合 1 为排列熵加信息熵;                       单参数识别效果均较差时,比如偏度加能量组合,其
             组合 2 为信息熵加偏度;组合 3 为排列熵加偏度;组                       双参数 SVM 的识别效果虽然依然较差,但较其各
             合 4 为峰度加能量。对不同的参数组合采用十折交                          自单参数识别效果有显著的改善。
             叉验证的方法测试其分类效果:将数据集随机平均                                本文认为高斯核函数将特征空间新向量表示
             分为10份,轮流将其中9 份作为训练集,剩余1 份作                        为原始空间映射函数的内积,构建新的高维线性可
             为测试集,进行 10 次模型训练和 B 线识别,计算不                       分特征空间,并建立一个线性超平面对样本进行分
             同参数组合的受试者工作特征 AUC,平均灵敏度、                          类,新的特征空间包含了特征参数各自对于分类的
             平均特异性和平均准确率如表3所示。                                 相关性,使参数组合具有了与其各自对分类的相关
                                                               性相比更高的相关性,提高了分类准确率。
                  表 3  不同输入组合十折交叉验证结果统计
                                                               2.4  后处理
                Table 3 Ten fold cross validation results
                for different input combinations                    由于本文基于 RF 数据提取的 B 线区域与非 B
                                                               线区域的信息熵与排列熵是线性不可分的,采用了
               特征参数组合       灵敏度/% 特异性/%      准确率/% AUC
                                                               高斯核的非线性 SVM 进行分类,模型中引入了惩
              信息熵 + 排列熵      90.521  98.106   96.328  0.95     罚因子,因此在更高维度的特征空间中进行分类时,
               信息熵 + 峰度      65.071  94.205   84.494  0.85     分类模型对于边界间的样本是有一定容忍度的,即
               排列熵 + 峰度      84.138  82.555   83.083  0.89     允许一定的错误分类的情况出现,这是因为对于惩
                                                               罚因子过大时,识别模型对错分情况容忍度很低,会
                偏度 + 能量      39.359  83.228   68.605  0.70
                                                               出现过拟合;惩罚因子过小时,可能导致无法达到
                 由表 3 可知,4 个组合输入 SVM 的识别效果最                    分类效果,出现欠拟合现象。与之对应的,本文采
             好的是信息熵加排列熵组合,将该组合作为输入                             用信息熵、排列熵双参数非线性 SVM 识别后的结
             的 B 线识别平均灵敏度为 90.521%,平均特异性为                      果显示,一张超声图像中识别错误的情况大致分为
             98.106%,平均准确率为96.328%,AUC等于0.95,均                 两类:一是将非 B 线区域中的若干扫描线识别为 B
             为 4 种组合中的最高值,可以较好的实现对 B 线的                        线;二是将 B线区域中的若干扫描线识别为非 B线。
             识别。识别效果最差的是偏度加能量组合,将该组                            图 2 展示了 SVM识别效果图,其中识别为 B线的扫
             合作为输入的 B 线识别平均灵敏度为 39.359%,平                      描线用蓝色半进行了标注。

             均特异性为 83.228%,平均准确率为 68.605%,AUC                      分析识别错误的识别对象,发现出现识别错误
             等于 0.70。信息熵加峰度双特征参数组合对 B 线                        的线束大多为图像中位置分散的单独扫描线或少
             的平均识别灵敏度 (灵敏度= 65.071%)较信息熵加                      量连续扫描线,而 B 线的宽度总是 > 3 条扫描线的
             排列熵 (灵敏度 = 90.521%) 以及排列熵加峰度 (灵                   宽度,同一条 B 线包含的扫描线在图像中的位置是
             敏度 = 84.138) 较低,但由于其平均特异性 (特异                     连续的,并且 B 线从胸膜线产生,一直延续到屏幕
             性 = 94.205%) 较排列熵加峰度组合高,故组合二、                     底端。根据以上性质,本文在SVM识别的基础上提
             组合三的识别平均准确率相近,分别为 84.494% 和                       出了一种后处理的算法,可以有效地提高 B 线识别
             83.083%。                                          效果。
                 与表 2中单参数贝叶斯分类器识别效果对比可                             对于 SVM 模型的识别结果,后处理算法首先
             知,特征参数两两组成双参数特征参数组合输入非                            遍历其识别为 B 线的扫描线位置,找到被识别为 B
             线性 SVM 得到的 B 线识别效果要优于该组合中单                        线,但与其他B线间隔> 5 (每根扫描线的宽度为1)
   16   17   18   19   20   21   22   23   24   25   26