Page 104 - 《应用声学》2020年第1期
P. 104

100                                                                                  2020 年 1 月


             单位阶跃函数,当t > 0 时,u(t) = 1,否则,u(t) = 0;                 本文在计算该值时选用矩形窗函数,考虑人的
                                ∫
                                  +∞                           听觉特性,使用短时能量的自然对数 ln(E n ) 作为特
             θ 值的选择应当满足              ψ(t)dt = 0;b 是时移变
                                                               征参数,并称之为对数能量            [10] 。
                                 −∞
             量,a 是尺度变量,a 取值与耳蜗滤波器组的中心频
                                                               3.3  组合特征
             率分布有关,定义为最低中心频率 f l 与当前中心频
                                                                   使用瞬时频率特征和对数能量特征联合获得
             率 f c 的比值,即 a = f l /f c 。图 1 显示了耳蜗滤波器
                                                               组合特征参数,主要具有两大优势:首先,对数能量
             组的幅频响应。
                                                               从能量的角度描述车辆噪声信号,瞬时频率从相位
             3.1 瞬时频率特征                                        的角度描述车辆噪声信号,两者具有互相补充作用;
                 使用耳蜗滤波器组提取瞬时频率特征的步骤                           其次,对数能量作为标量值,不会引起特征维度过高
                                                               而导致运算量过大问题。本文将瞬时频率特征和对
             如下:
                                                               数能量联合获得组合特征,计算每帧的对数能量作
                 (1) 在分析频率范围内设计 K 个耳蜗滤波器,
                                                               为该组合特征参数的第 1 维特征,组合特征的维数
             其中心频率分布为线性或非线性尺度。
                                                               为14。
                 (2) 使用耳蜗滤波器组对车辆噪声信号滤波处
             理,一共获得 K 个子带信号,使用式 (12) 估计每个
                                                               4 特征评价
             子带信号每帧的瞬时频率,假设一共分了 N 帧,那
             么就会获得一个K × N 的矩阵。                                     在进行目标识别时,要求所提取的特征尽可能
                 (3) 使用等效矩形带宽 (Equivalent rectangu-            区分各个模式类,希望其类内间距尽可能小,类间间
             lar bandwidth, ERB) 尺度压缩瞬时频率动态范围,                 距尽可能大。为了衡量本文所提取车辆噪声信号特
             该尺度的计算公式定义为 f ERB = 21.4 × lg(4.37 ×              征的优劣,援引文献[11]构造特征距离可分性测度:
             f/1000 + 1),其中 f 为线性频率,f ERB 为压缩后的                                  d ({a i }, {b j })
                                                                                  2
                                                                   J A,B =                           ,   (16)
                                                                                          2
                                                                           2
             频率。                                                          d ({a i }, {a i }) + d ({b j }, {b j })
                 (4) 使用离散余弦变换进行去相关和降维处理,                       其中,d (a i , b j ) 表示 A 与 B 的类间距离的平方,对
                                                                      2
             将所提取的特征记为IF特征。                                    应两类特征集合 {a i , i = 1, 2, · · · , k a } 和 {b i , i =
                 本文的分析频率范围为 50 Hz∼ f s /2,f s 为最               1, 2, · · · , k b },其中 a i ∈ A 类,b i ∈ B 类,计算公式
             终采样频率,对于数据集1 f s = 4960 Hz,对于数据                   如下:
             集2 f s = 16 kHz。滤波器的个数为 40,特征维数为                                           k a  k b
                                                                   2               1   ∑ ∑     2
                                                                  d ({a i }, {b j }) =        d (a i , b j ).  (17)
             13。滤波器组的中心频率分布选择线性尺度和 Mel                                           K a K b
                                                                                       i=1 j=1
             尺度两种。
                                                               d ({a i }, {a i }) 为类内距离的平方,对于某一类特征
                                                                2
             3.2 对数能量                                          集合{a i , i = 1, 2, · · · , k}, 定义为
                                                                                            k
                                                                                               k
                 信号的短时能量用来度量其幅值变化,定义为                                                1     ∑ ∑
                                                                   2
                                                                                                   2
                                                                  d ({a i }, {a i }) =           d (a i , a j ).
             加窗声信号区域的振幅绝对值的平方和。其表达式                                              K(K − 1)
                                                                                           i=1 j=1
             如下:                                                                                         (18)
                            n
                           ∑                    2              通常J A,B 越大,类别间可分性越好;J A,B 越小,其可
                  E n =           [x(m)w(n − m)] ,     (14)
                                                               分性越差。
                       m=n−(N−1)
                                                                   耳蜗滤波器的带宽会影响到IF特征的提取,带
             其中,E n 是短时能量,x(m) 是待分析的车辆噪声信
                                                               宽过窄,会遗漏重要频率成分;带宽过宽,会影响
             号,w(n) 是窗函数,N 是窗长。当窗函数为矩形窗
                                                               到瞬时频率估计,如何选择合适的带宽是需要进一
             时,短时能量描述如下:
                                                               步研究的问题。根据上文描述,其带宽可以通过 β
                                  n
                                 ∑
                                          2
                         E n =          x (m).         (15)    值调节,β 值通常取 0.035 或 0.2。本节通过实验来
                              m=n−(N−1)                        研究特征的可分性,其中 IF 特征是在 Mel 尺度下
   99   100   101   102   103   104   105   106   107   108   109