Page 20 - 《应用声学)》2023年第5期
P. 20

912                                                                                  2023 年 9 月


             2.2 单参数分析                                         和标准差并使用独立样本 t 检验判断其是否有显著
                 本文共选取 100 帧 RF 原始数据,依据 B 线从                   差异性,如表 1 所示。最后将各个参数随机平均分
             胸膜线产生并延伸至屏幕底部、与肺滑行同步运                             为10份,轮流取其中9份作为训练集,剩下1份作为
             动、呈现离散、激光样垂直高回声的伪影表现的特                            测试集输入贝叶斯分类器,得到单参数分类的平均
             征,对所有识别对象标定 B 线或非 B 线标签。分别                        灵敏度、特异性、准确率和曲线下面积 (Area under
             统计 B 线区域与非 B 线区域各个特征参量的均值                         curve, AUC)如表2所示。


                                                  表 1   特征参数统计特征
                               Table 1 Statistical characteristics of characteristic parameters

                                         B 线                         非 B 线               独立样本 t 检验
                     特征参数
                                   均值          标准差              均值          标准差           P     显著性
                      信息熵         8.589        0.2253           8.134       0.443        <0.05    是
                      排列熵         1.974         0.119           2.454       0.287        <0.05    是
                       峰度         28.373       15.786          45.908       22.384       <0.05    是
                       偏度      −5.067 × 10 −5  6.755 × 10 −4  2.392 × 10 −4  1.22 × 10 −3  <0.05  是
                       能量       6.142×10 8    4.35×10 8      4.668 × 10 8  4.087 × 10 8  <0.05    是

                     表 2   特征参数单参数贝叶斯分类                        复规律性,这使得表 1 中数据显示与非 B 线区域相
                Table 2 Bayesian classification results of      比,信息熵显示 B 线区域信号混乱程度更高而排列
                single characteristic parameters               熵却显示其更具有规律性。
                                                                   表 2 中单参数的贝叶斯分类器分类结果显示
                 特征参数 灵敏度/% 特异性/%         准确率/% AUC
                                                               信息熵 (灵敏度 72.547%,特异性 91.337%,准确率
                  信息熵     72.547   91.337  85.074  0.91
                                                               85.074%,AUC= 0.91) 和排列熵 (灵敏度 89.953%,
                  排列熵     89.953   78.303  82.186  0.90
                                                               特异性 78.303%,准确率 82.186%, AUC= 0.90) 的
                   峰度     26.384   96.203  72.930  0.72
                                                               识别效果最好,峰度、偏度和能量3 个参数识别特异
                   偏度      3.283   96.895  65.691  0.60
                   能量      8.228   92.484  64.399  0.61        性较高,灵敏度较低且与信息熵和排列熵相比差距
                                                               较大。表明排列熵与信息熵对于判断 RF 信号是否
                 由表 1 可见,对本文提取的 5 个特征参数分                       为B线的能力较上述其他特征参数更高。贝叶斯分
             别进行独立样本 t 检验后,结果显示 B 线与非 B                        类灵敏度较低的3个特征参数(峰度、偏度、能量) 其
             线的上述所有特征参数之间均具有显著差异性                              标准差较大,B 线与非 B 线相应特征参数数值重合

             (P < 0.05)。可以发现,B 线排列熵均值 (1.974) 显                区间内识别对象数量较多,导致大多数 B 线数据被
             著低于非 B 线排列熵均值 (2.454);B 线信息熵均值                    分类为非 B 线,从而使得分类模型表现出灵敏度非
             (8.589) 显著高于非 B 线信息熵均值 (8.134)。这是                 常低而特异性非常高的特点。
             因为信息熵与排列熵分别从两个不同方面反映了
             信号的复杂程度,信息熵从信号幅值出现的概率密                            2.3  基于非线性SVM的双参数B线识别
             度评估信号在宏观上的混乱程度,排列熵却并不关                                由2.2 节可知,基于 B 线和非B 线RF 数据提取
             注信号具体幅值,而是分析信号重构分量内数据升                            的特征参数虽然有显著差异性,但其数值均有一
             序排列顺序出现的概率,排列熵侧重于被分析信号                            定程度上的重合,而这样线性不可分的性质对贝
             内相似片段的重复性,而对相似片段内信号幅值较                            叶斯分类器有较差的影响。为了获得更好的分类
             小的波动变化以及异常点并不敏感,相比于信息熵,                           效果并且寻找上述参数中识别效果最好的双参数
             排列熵弱化了 B 线信号衰减等其他因素导致的信                           组合,选择单参数贝叶斯分类中识别效果前三的参
             号幅值变化的影响,突出了 B 线信号在微观上的重                          数 (信息熵、排列熵和峰度) 组成 3 组双特征参数组
   15   16   17   18   19   20   21   22   23   24   25