Page 82 - 201806
P. 82

912                                                                                 2018 年 11 月


             是不同的,而无人机声信号是平稳的,可以看作是                            很多,这就意味着这种滤波方式对分布在高频部分
             一种持续平稳的音素,同样可以使用 MFCC 技术                          的特征并不敏感,而对于稳态强谐波分布在高频区
             进行特征提取。并且针对无人机声信号与语音信                             域的飞行器声信号,如果使用传统 MFCC方法进行
             号的这种在平稳性方面的差异又可以对 MFCC 进                          声信号的特征提取,滤波器就会像处理语音信号一
             行有针对性的改进,以使其更加符合无人机声信                             样进行大尺度压缩,使梅尔滤波器对分布在高频区
             号频谱的分布特点。从图 4 中还可以看出,语音信                          域的信号敏感度降低,从而丢失高频的稳态强谐波
             号在不同时刻信号的谐波波峰对应的频率分布差                             附近信号的分布特点。为了突出该类特征,使特征
             距较大,在频率轴上呈现不规则的分布,而无人机                            提取参数更加有效和稳定,本文针对低空飞行器声
             声信号的高频段分量较多,并且无人机声信号频谱                            信号的稳态强谐波特性,对梅尔滤波函数进行加权
             中的谐波波峰具有明显的分布特点。这类波峰总                             改进。
             是在某些特定的频段附近出现,如图 4(b) 中出现在                        3.2  稳态强谐波的提取与梅尔滤波器的改进

             7.5 kHz∼8.5 kHz、3.5 kHz∼4.5 kHz附近,这是螺旋                声信号频谱图中的稳态强谐波携带了飞行器
             桨驱动类飞行器非常重要的特点,所以应该在特征                            的固有特征,比如飞行器机械结构与螺旋桨转速,能
             提取过程中对无人机声信号的这种分布特点加以                             否准确地定位到该类谐波所在频段是特征提取的
             突出。而传统的MFCC特征提取方法使用梅尔滤波                           关键。本文将多帧信号采用高阶中心滑动均值滤波
             器将频率非线性地转化到梅尔域时,采用的转换函                            方法进行包络提取后,对重合度高的峰值点进行提
             数是固定的。从图 2 线性频率与梅尔频率转换曲线                          取,定义这类峰值对应谐波为稳态强谐波。中心滑
             可以看出,在高频部分,曲线的斜率相比低频部分低                           动均值滤波的公式表达如下:


                                          
                                              a+1 +i−1
                                          
                                           1  2  ∑                     a + 1
                                          
                                                    r(i),      1 6 i <      ,
                                          
                                          a                              2
                                          
                                               j=1
                                          
                                          
                                          
                                                a+1
                                              i+
                                                  2
                                           1   ∑               a + 1           a + 1
                                   R(i) =            r(i),            6 i 6 N −      ,                    (4)
                                           a                     2               2
                                                 a−1
                                          
                                             j=i−  2
                                          
                                          
                                                  N
                                           1     ∑                  a + 1
                                          
                                          
                                                         r(i), N −       < i 6 N,
                                          
                                          a                           2
                                          
                                                   a+1
                                              j=N−    −i+1
                                                    2
             其中,r(i)表示原始频谱序列,R(i)表示滤波后的频                           根据低空飞行器结构特点,选定重复度较高的
             谱序列,a表示窗口值。经过滤波后提取到声信号频                           并且幅值最大的两个峰值所在谐波进行转换曲线
             谱的包络线,如图5所示。                                      斜率的加权提升,也就是在梅尔滤波器中减小稳态
                                                               强谐波处的三角滤波器跨度,提高滤波器对该部位
                  0.12
                                                               的感知敏感的。
                  0.10
                                                                   使用高阶中心滑动均值滤波方法提取的稳态
                 ॆʷӑᮠ៨ࣨϙ  0.06                                 强谐波以对应的频率作为标记点,并未考虑到每个
                  0.08
                                                               该谐波处的能量分布。从图 5 可以看出,显然左侧
                  0.04
                  0.02                                         谐波的能量小于右侧谐波,在噪声环境中,能量高的
                                                               谐波分量抗噪能力更强,更不容易被掩盖,为了突出
                    0                                          能量较强的、更加稳定的稳态强谐波,将基于该频
                     0     2    4     6    8    10    12
                                   ᮠဋ/kHz
                                                               点的能量峰均比进行滤波曲线的加权。
                        图 5  小型无人机的频谱包络                            首先将频谱进行分频,频带宽度为 f d ,假设稳
                      Fig. 5 Spectral envelope of drone        态强谐波对应频率为 f 0 ,计算该带宽f d 内的能量峰
   77   78   79   80   81   82   83   84   85   86   87