Page 83 - 201806
P. 83

第 37 卷 第 6 期         肖寒春等: 改进的梅尔倒谱系数在低空飞行器特征提取中的应用                                          913


             均比PAPR:                                           感知敏感度为
                                                                                         2595
                                   f 0 +f d /2                             ′                              (7)
                                     ∑                                   F Mel (f 0 ) =           .
                                           R(i)                                     (700 + f 0 ) ln 10
                                  i=f 0 −f d /2                    加权的思想是增加稳态强谐波 f 0 处的感知敏
                                =              .        (5)
                        PAPR f 0     ∑
                                        R(i)                   感度,即线性频域与梅尔域转换曲线在该处的斜率。
                                                               为了防止多普勒效应导致的谐波的频移现象,对以
                 梅尔滤波的转换曲线斜率大小反映了算法对
                                                               f 0 为中心频率、频宽 f d 的整个频段进行加权。加权
             该频带内信号特征的敏感度,为了直观地显示
                                                               的实现是通过将以 f 0 为中心频率的频段投影到敏
             MFCC 算法对各个频带的敏感度,对转换曲线进行
                                                               感度较高的以 f 为中心频率的频段。然后用 f 频
                                                                              ′
                                                                                                          ′
             求导并定义导数值为敏感度值:                                                  0                            0
                                                               段内的敏感度替代 f 0 频段的敏感度。f 处的敏感
                                                                                                   ′
                                                                                                   0
                     ′
                    F Mel (f) = ∇ f (F Mel )                   度计算公式如下:
                                 [                ]
                                              f                        ′   ′     ′
                                        (        )
                           = ∇ f 2595 lg 1 +                         F Mel (f ) = F Mel (0) · PAPR f 0
                                                                           0
                                              700
                                                                                    ′
                                  2595                                          + F Mel  (f 0 )(1 − PAPR f 0 ),  (8)
                           =               .            (6)
                              (700 + f) ln 10
                                                               然后使用公式 (6) 计算出 f ,此时改进的线性频域
                                                                                       ′
                                                                                       0
                                                                                   ˜
                 假设稳态强谐波的谐波频率为f 0 ,则f 0 对应的                    与梅尔域的转换函数F Mel (f)表达式为
                               
                               F Mel (f),                                  f 6 f 0 − f d /2,
                               
                               
                               
                     ˜
                                                   ˜
                     F Mel (f) =  F Mel (f − f 0 + f ) + F Mel (f 0 − f d /2),  f 0 − f d /2 6 f 6 f 0 + f d /2,  (9)
                                               ′
                                               0
                               
                               
                                                          ˜
                                F Mel (f) − F Mel (f 0 + f d /2) + F Mel (f 0 + f d /2), f 0 + f d /2 6 f.
                 改进的MFCC特征提取步骤如下:                              4 仿真结果与分析
                 (1) 对声信号进行分帧加窗处理;
                                                                   分 别 使 用 传 统 MFCC 方 法 以 及 本 文 改 进
                 (2) 进 行 离 散 傅 里 叶 变 换 (Discrete Fourier
                                                               MFCC 方法对小型无人机进行小型低空飞行器
             transform, DFT) 得到信号的频谱,然后采用高
                                                               的声特征提取,采用高斯混合模型(Gaussian mixed
             阶中心滑动均值滤波方法提取频谱包络线R i ;
                                                               mode, GMM) 进行分类识别。GMM 是一种经典的
                 (3) 对包络进行波峰检测,多帧比对,选取重复
                                                               统计分类模型,它用多个高斯概率密度函数进过加
             度较高的且幅度最大的两个峰值频点作为稳态强
                                                               权组合对变量的变化规律进行模拟。由于高斯函数
             谐波,对应谐波频率为f 0 ;
                                                               可以较好地描述真实数据的分布,而且高斯分布经
                 (4) 使用公式(5)计算f 0 为中心频率,频带宽度
                                                               过线性组合之后仍然是高斯分布,理论上可以用若
                                          ;
                                                               干个高斯分布的组合模拟任意统计分布,因此,可以
             f d 区域内的能量峰均比PAPR f 0
                 (5) 使用公式 (7)、公式 (8) 计算 f 0 的投影频点
                                                               通过样本训练模拟出样本特征的分布特性,准确地
             f ,将线性频谱与梅尔频谱转换曲线中 f 0 频段内的
              ′
              0                                                对样本的输出概率进行预测。在说话人识别系统中,
             低感知度替换为 f 的高感知度,得到改进后的线性
                             ′
                             0                                 研究者将 GMM 与 MFCC 方法相结合进行音素的
                                    ˜
             频谱与梅尔频谱转换曲线F Mel (f);                             识别并取得了很好的识别效果,文献 [10]将MFCC-
                 (6) 使用改进后的梅尔滤波器进行滤波,然后                        GMM 方法引入舰船及鲸类噪声的分类识别中,同
             进行离散余弦变换提取MFCC特征参数。                               样取得了较好效果,而本文将 MFCC-GMM 方法应
                 改进后的梅尔滤波器不再严格按照人耳听觉                           用到无人机的分类识别中,以验证改进的MFCC方
             机制,而是针对飞行器声信号中的稳态强谐波进行                            法对识别系统性能的提升。
             敏感度的提升,扩大了该类谐波附近的信号特征在                                本文以虚警率(False alarm rate, FAR)、漏警率
             整个MFCC特征向量中的比重。                                   (Leakage alarm rate, LAR)以及等误识别率(Equal
   78   79   80   81   82   83   84   85   86   87   88