Page 225 - 《应用声学》2023年第3期
P. 225

第 42 卷 第 3 期               张书文等: 呼吸声分类技术研究及检测系统设计                                           663


                                                               式对于样本特征数过多时时间耗费较大,因此只适
                                            ऀѵ
                                                               合样本较少的简单模型中。
                                                                   第二种 KD树实现原理并不是直接对样本进行
                                                 ऀѵ
                                                               测试与分类,而是先对训练集建模,建立的模型就是

                                               ௑ᫎ t            KD 模型,然后在对数据进行预测。图6 为 KD 树的
                        图 5  声音信号的 DTW 处理                      计算流程图,KD 数采用的是从样本的 N 为特征数
                                                               量中取方差最大的第 k 个特征值作为根节点,然后
                   Fig. 5 DTW processing of sound signal
                                                               根据此根节点,将数据按大于还是小于划分为左右
                 假设匹配A(a 1 , a 2 , a 3 , · · · , a i , · · · , a n )和 B(b 1 ,
                                                               子树,最后通过同样的办法递归形成KD树。
             b 2 , b 3 , · · · , b j , · · · , b m )两个序列的相似性,为了对齐
             两个序列,需要构造一个矩阵网格 C,该网格由矩                                ྲढ़ག஝૶
                                                                     features        Kn < nT  Ѭҟ     Kn ĺ nT
             阵元素 C(i, j) 构成,C(i, j) 表示序列 a j 与 b j 的欧                                         ஝૶
             氏距离,该网格中存在一个最短路径使得距离累加
             值 Dist 最小。该累加值也就是两个声音序列的相                              ࡙नKDಞ          ࢻߕಞྲढ़           Կߕಞྲढ़
                                                                                                    ག஝૶
                                                                                     ག஝૶
             似值。
                                     {                                                             ࡙नࢻߕಞ
                 Dist = d(q i , c j ) + min Dist(i − 1, j − 1),    ᤥહతܸவࣀ          ࡙नࢻߕಞ
                                                                      ፥஝n
                                                }
                       Dist(i − 1, j), Dist(i, j − 1) .  (6)
                                                                 ᤥહతܸவࣀ፥஝n
                 经过 DTW处理之后的时间片段可以减少因呼                           ᄊ˗ϙͻ˞᫠ϙnT
             吸速率及发音震动缓急产生的特征值误差。通过
             将不同语声以及自身的MFCC特征序列进行DTW
                                                                             图 6  KD 树计算流程图
             处理可以得到 DTW 矩阵 (欧几里得相似距离矩阵)
                                                                       Fig. 6 KD tree calculation flowchart
             和相似值 (距离)。由 DTW 矩阵得到的相似值可以
             表明不同语声信号的相似性,所以该矩阵可以作                             2 系统设计
             为 K 最临近 (K-nearest-neighbor, KNN) 划分样本
             空间的依据。                                                传统声频采集装置对微弱的体声信号采集达
                                                               不到要求,其采集效果往往不是很理想。而本文提
             1.5 KNN算法分类
                                                               出的使用 PVDF 薄膜传感器来采集呼吸声信号的
                 采集的呼吸声音进行 Mel 倒谱系数的计算提
                                                               检测系统采集声频信号分辨率高,可以检测到低频
             取之后,需要使用某种方式对呼吸声音进行分类。
                                                               小信号。
             由于异常呼吸声音的样本采集较为困难,不能提取
                                                                   图 7 是该呼吸检测系统的实物图。该系统采用
             大量数据。尤其是针对于卷积神经网络这种需要大
                                                               36 V 供电电压、3300 mAh 电池容量的锂电池为整
             量数据进行迭代回归等方式。所以选择 KNN 算法
                                                               个系统供电。电源经过直流降压之后给PVDF薄膜
             进行呼吸声音的分类。
                 KNN 算法的核心思想是当一个样本空间 k 个
             最邻近的样本中大多数属于某个类别,则样本也属
             于这个类别,并具有该类别的特征。KNN 方法主要
             依据的是靠周围有限的邻近的样本,而不是靠判别
             类域的方法来确定所属类别的,因此对于类域的交
             叉或者重叠较多的待分样本集来说,KNN方法较其
             他方法更为适合。
                 KNN 算法的原理有两种,一种是蛮力实现原
             理,另一种是 KD 树实现原理。蛮力实现原理是计                                        图 7  检测系统实物图
             算预测样本与所有训练集中的样本距离 d。这种方                                    Fig. 7 Picture of detection system
   220   221   222   223   224   225   226   227   228   229   230