Page 240 - 《应用声学》2025年第1期
P. 240

236                                                                                  2025 年 1 月


             现了融合优化特征集的构建;最终,本文对 32 种声                         后,数据增广与均衡处理模块采用改进 SMOTE 算
             学特征进行了归纳与分类,将其划分为时域类特征                            法实现对声学特征数据的有效扩展,以确保样本的
             和频域类特征,并深入探究不同类型声学特征对病                            均衡性;在特征融合优化阶段,系统结合ECFS算法
             理嗓音分类系统性能的影响。                                     与盒图方法,从双重维度对声学特征进行综合评估,

                                                               从而构建出融合优化特征集;最终,基于该融合优化
             1 病理嗓音检测系统
                                                               特征集,本文构建高性能病理嗓音分类模型,并结合
                 本文提出的病理嗓音检测系统流程如图 1 所                         前期归类整理的声学特征,深入探讨了不同域别的
             示。该系统首先基于不同类型病理嗓音样本,提取                            声学特征对各类病理嗓音检测性能的差异化影响。
             多维声学特征,并依据声学特征的定义属性及其反                            整个系统在解决数据不平衡和特征冗余等问题的
             映声音信号特性的差异,实现对特征的归类整理;随                           同时,也显著提升了多类病理嗓音检测的性能。


                           ྲढ़                                ྲढ़
                   ኄ መჁေ   ྲढ़                        ኄ መჁေ   ྲढ़
                    رᮃዝی                             رᮃዝی
                           ྲढ़n                               ྲढ़n
                       ⊲⊲⊲⊲⊲⊲                            ⊲⊲⊲⊲⊲⊲
                           ྲढ़                                ྲढ़
                   ኄmመჁေ ྲढ़                          ኄmመჁေ ྲढ़
                    رᮃዝی                             رᮃዝی                                         ECFS
                           ྲढ़n                               ྲढ़n
                                              ஝૶ܙࣹ                                     ܳྲढ़
                                              کᛦܫေ                                    ᚸՌ͖ӑ
                           ᣥК
                                                                                                  ᄤڏ
                                                                  ྲढ़
                                                         ኄ መჁေ
                                                          رᮃዝی    ྲढ़n
                                                            ⊲⊲⊲⊲⊲⊲
                                           ྲढ़ॆዝடေ
                                                                  ྲढ़
                                                         ኄmመჁေ
                                                          رᮃዝی
                                                                 ྲढ़n
                              ᣥѣ          ჁေرᮃѬዝ٨
                                            ౞थˁᰎ᝽
                                                图 1  病理嗓音检测系统流程图
                                     Fig. 1 Flowchart of the pathological voice detection system

             1.1 特征归类整理                                        识别每个种子样本的 k 个最近邻,并分析这些邻居
                 本文对32种     [17]  病理性语声特征的定义及具体                的类别构成,特别关注多数类样本的比例。若多数
             提取过程进行了详细的剖析 (文献 [17] 涵盖 32 种特
             征的详尽描述),如图 2 所示,将其归纳为时域类特
             征和频域类特征。时域类特征描述信号在时间上的
                                                                                    Tsam SPI  NSH
                                                                                  SEG
             变化和属性,频率类特征聚焦信号在频率上的变化。                                            PER        DUV
                                                                              DVB            DSH
                                                                            NUV                VTI
             1.2 数据的增广均衡处理                                                 NVB                  NHR
                                                                ௑۫ዝ 37.5%
                                                                          Shim                   FTRI
                 针对少数类样本稀缺导致分类器倾向于预测
                                                                         ShdB                    sPPQ
             多数类别的问题,本文基于 SMOTE 算法                [28−29]  进              APQ                    PPQ
             行了改进,以实现对声学特征数据的增广与均衡处                                       sAPQ                   RAP
                                                                           vAm                  Jitt  62.5%  ᮠ۫ዝ
             理。该算法通过聚焦于生成新的合成样本,特别是                                         ATRI               Jita
                                                                              Fhi            vFo
             针对决策边界附近的少数类样本,以增强分类器对                                             To         STD
                                                                                  Flo
                                                                                    Fftr  Fatr  PFR
             这些关键区域的识别能力。具体步骤如表1所示:首
             先,从原始语声特征数据集中随机抽取少数类样本
             作为种子样本,随后计算这些种子样本与其余非种                                         图 2  32 种特征的归类图
             子样本之间的欧几里得距离。接着,运用k 近邻算法                                 Fig. 2 Categorization of the 32 Features
   235   236   237   238   239   240   241   242   243   244   245