Page 240 - 《应用声学》2025年第1期
P. 240
236 2025 年 1 月
现了融合优化特征集的构建;最终,本文对 32 种声 后,数据增广与均衡处理模块采用改进 SMOTE 算
学特征进行了归纳与分类,将其划分为时域类特征 法实现对声学特征数据的有效扩展,以确保样本的
和频域类特征,并深入探究不同类型声学特征对病 均衡性;在特征融合优化阶段,系统结合ECFS算法
理嗓音分类系统性能的影响。 与盒图方法,从双重维度对声学特征进行综合评估,
从而构建出融合优化特征集;最终,基于该融合优化
1 病理嗓音检测系统
特征集,本文构建高性能病理嗓音分类模型,并结合
本文提出的病理嗓音检测系统流程如图 1 所 前期归类整理的声学特征,深入探讨了不同域别的
示。该系统首先基于不同类型病理嗓音样本,提取 声学特征对各类病理嗓音检测性能的差异化影响。
多维声学特征,并依据声学特征的定义属性及其反 整个系统在解决数据不平衡和特征冗余等问题的
映声音信号特性的差异,实现对特征的归类整理;随 同时,也显著提升了多类病理嗓音检测的性能。
ྲढ़ ྲढ़
ኄ መჁေ ྲढ़ ኄ መჁေ ྲढ़
رᮃዝی رᮃዝی
ྲढ़n ྲढ़n
⊲⊲⊲⊲⊲⊲ ⊲⊲⊲⊲⊲⊲
ྲढ़ ྲढ़
ኄmመჁေ ྲढ़ ኄmመჁေ ྲढ़
رᮃዝی رᮃዝی ECFS
ྲढ़n ྲढ़n
ܙࣹ ܳྲढ़
کᛦܫေ ᚸՌ͖ӑ
ᣥК
ᄤڏ
ྲढ़
ኄ መჁေ
رᮃዝی ྲढ़n
⊲⊲⊲⊲⊲⊲
ྲढ़ॆዝடေ
ྲढ़
ኄmመჁေ
رᮃዝی
ྲढ़n
ᣥѣ ჁေرᮃѬዝ٨
थˁᰎ
图 1 病理嗓音检测系统流程图
Fig. 1 Flowchart of the pathological voice detection system
1.1 特征归类整理 识别每个种子样本的 k 个最近邻,并分析这些邻居
本文对32种 [17] 病理性语声特征的定义及具体 的类别构成,特别关注多数类样本的比例。若多数
提取过程进行了详细的剖析 (文献 [17] 涵盖 32 种特
征的详尽描述),如图 2 所示,将其归纳为时域类特
征和频域类特征。时域类特征描述信号在时间上的
Tsam SPI NSH
SEG
变化和属性,频率类特征聚焦信号在频率上的变化。 PER DUV
DVB DSH
NUV VTI
1.2 数据的增广均衡处理 NVB NHR
۫ዝ 37.5%
Shim FTRI
针对少数类样本稀缺导致分类器倾向于预测
ShdB sPPQ
多数类别的问题,本文基于 SMOTE 算法 [28−29] 进 APQ PPQ
行了改进,以实现对声学特征数据的增广与均衡处 sAPQ RAP
vAm Jitt 62.5% ᮠ۫ዝ
理。该算法通过聚焦于生成新的合成样本,特别是 ATRI Jita
Fhi vFo
针对决策边界附近的少数类样本,以增强分类器对 To STD
Flo
Fftr Fatr PFR
这些关键区域的识别能力。具体步骤如表1所示:首
先,从原始语声特征数据集中随机抽取少数类样本
作为种子样本,随后计算这些种子样本与其余非种 图 2 32 种特征的归类图
子样本之间的欧几里得距离。接着,运用k 近邻算法 Fig. 2 Categorization of the 32 Features