Page 21 - 《应用声学)》2023年第5期
P. 21
第 42 卷 第 5 期 张皓宇等: 基于超声射频信号的支持向量机双参量 B 线识别方法 913
合,以及识别效果最差的两个参数 (偏度和能量) 组 参数识别效果较差的特征参数的识别效果。当组成
成一组双特征参数组合,将上述 4 个特征参数组合 双特征参数组合的两个特征参数的单参数识别效
输入非线性 SVM 进行分类,本研究使用的 SVM 基 果均较好时,比如信息熵加排列熵组合,其双参数
于 MATLAB 中 LibSVM 工具箱,采用高斯径向核 SVM 对 B 线的识别效果显著优于其单独的识别效
函数。 果。同时,当组成双特征参数组合的两个特征参数
不同参数组合如下:组合 1 为排列熵加信息熵; 单参数识别效果均较差时,比如偏度加能量组合,其
组合 2 为信息熵加偏度;组合 3 为排列熵加偏度;组 双参数 SVM 的识别效果虽然依然较差,但较其各
合 4 为峰度加能量。对不同的参数组合采用十折交 自单参数识别效果有显著的改善。
叉验证的方法测试其分类效果:将数据集随机平均 本文认为高斯核函数将特征空间新向量表示
分为10份,轮流将其中9 份作为训练集,剩余1 份作 为原始空间映射函数的内积,构建新的高维线性可
为测试集,进行 10 次模型训练和 B 线识别,计算不 分特征空间,并建立一个线性超平面对样本进行分
同参数组合的受试者工作特征 AUC,平均灵敏度、 类,新的特征空间包含了特征参数各自对于分类的
平均特异性和平均准确率如表3所示。 相关性,使参数组合具有了与其各自对分类的相关
性相比更高的相关性,提高了分类准确率。
表 3 不同输入组合十折交叉验证结果统计
2.4 后处理
Table 3 Ten fold cross validation results
for different input combinations 由于本文基于 RF 数据提取的 B 线区域与非 B
线区域的信息熵与排列熵是线性不可分的,采用了
特征参数组合 灵敏度/% 特异性/% 准确率/% AUC
高斯核的非线性 SVM 进行分类,模型中引入了惩
信息熵 + 排列熵 90.521 98.106 96.328 0.95 罚因子,因此在更高维度的特征空间中进行分类时,
信息熵 + 峰度 65.071 94.205 84.494 0.85 分类模型对于边界间的样本是有一定容忍度的,即
排列熵 + 峰度 84.138 82.555 83.083 0.89 允许一定的错误分类的情况出现,这是因为对于惩
罚因子过大时,识别模型对错分情况容忍度很低,会
偏度 + 能量 39.359 83.228 68.605 0.70
出现过拟合;惩罚因子过小时,可能导致无法达到
由表 3 可知,4 个组合输入 SVM 的识别效果最 分类效果,出现欠拟合现象。与之对应的,本文采
好的是信息熵加排列熵组合,将该组合作为输入 用信息熵、排列熵双参数非线性 SVM 识别后的结
的 B 线识别平均灵敏度为 90.521%,平均特异性为 果显示,一张超声图像中识别错误的情况大致分为
98.106%,平均准确率为96.328%,AUC等于0.95,均 两类:一是将非 B 线区域中的若干扫描线识别为 B
为 4 种组合中的最高值,可以较好的实现对 B 线的 线;二是将 B线区域中的若干扫描线识别为非 B线。
识别。识别效果最差的是偏度加能量组合,将该组 图 2 展示了 SVM识别效果图,其中识别为 B线的扫
合作为输入的 B 线识别平均灵敏度为 39.359%,平 描线用蓝色半进行了标注。
均特异性为 83.228%,平均准确率为 68.605%,AUC 分析识别错误的识别对象,发现出现识别错误
等于 0.70。信息熵加峰度双特征参数组合对 B 线 的线束大多为图像中位置分散的单独扫描线或少
的平均识别灵敏度 (灵敏度= 65.071%)较信息熵加 量连续扫描线,而 B 线的宽度总是 > 3 条扫描线的
排列熵 (灵敏度 = 90.521%) 以及排列熵加峰度 (灵 宽度,同一条 B 线包含的扫描线在图像中的位置是
敏度 = 84.138) 较低,但由于其平均特异性 (特异 连续的,并且 B 线从胸膜线产生,一直延续到屏幕
性 = 94.205%) 较排列熵加峰度组合高,故组合二、 底端。根据以上性质,本文在SVM识别的基础上提
组合三的识别平均准确率相近,分别为 84.494% 和 出了一种后处理的算法,可以有效地提高 B 线识别
83.083%。 效果。
与表 2中单参数贝叶斯分类器识别效果对比可 对于 SVM 模型的识别结果,后处理算法首先
知,特征参数两两组成双参数特征参数组合输入非 遍历其识别为 B 线的扫描线位置,找到被识别为 B
线性 SVM 得到的 B 线识别效果要优于该组合中单 线,但与其他B线间隔> 5 (每根扫描线的宽度为1)