Page 104 - 《应用声学》2020年第1期
P. 104
100 2020 年 1 月
单位阶跃函数,当t > 0 时,u(t) = 1,否则,u(t) = 0; 本文在计算该值时选用矩形窗函数,考虑人的
∫
+∞ 听觉特性,使用短时能量的自然对数 ln(E n ) 作为特
θ 值的选择应当满足 ψ(t)dt = 0;b 是时移变
征参数,并称之为对数能量 [10] 。
−∞
量,a 是尺度变量,a 取值与耳蜗滤波器组的中心频
3.3 组合特征
率分布有关,定义为最低中心频率 f l 与当前中心频
使用瞬时频率特征和对数能量特征联合获得
率 f c 的比值,即 a = f l /f c 。图 1 显示了耳蜗滤波器
组合特征参数,主要具有两大优势:首先,对数能量
组的幅频响应。
从能量的角度描述车辆噪声信号,瞬时频率从相位
3.1 瞬时频率特征 的角度描述车辆噪声信号,两者具有互相补充作用;
使用耳蜗滤波器组提取瞬时频率特征的步骤 其次,对数能量作为标量值,不会引起特征维度过高
而导致运算量过大问题。本文将瞬时频率特征和对
如下:
数能量联合获得组合特征,计算每帧的对数能量作
(1) 在分析频率范围内设计 K 个耳蜗滤波器,
为该组合特征参数的第 1 维特征,组合特征的维数
其中心频率分布为线性或非线性尺度。
为14。
(2) 使用耳蜗滤波器组对车辆噪声信号滤波处
理,一共获得 K 个子带信号,使用式 (12) 估计每个
4 特征评价
子带信号每帧的瞬时频率,假设一共分了 N 帧,那
么就会获得一个K × N 的矩阵。 在进行目标识别时,要求所提取的特征尽可能
(3) 使用等效矩形带宽 (Equivalent rectangu- 区分各个模式类,希望其类内间距尽可能小,类间间
lar bandwidth, ERB) 尺度压缩瞬时频率动态范围, 距尽可能大。为了衡量本文所提取车辆噪声信号特
该尺度的计算公式定义为 f ERB = 21.4 × lg(4.37 × 征的优劣,援引文献[11]构造特征距离可分性测度:
f/1000 + 1),其中 f 为线性频率,f ERB 为压缩后的 d ({a i }, {b j })
2
J A,B = , (16)
2
2
频率。 d ({a i }, {a i }) + d ({b j }, {b j })
(4) 使用离散余弦变换进行去相关和降维处理, 其中,d (a i , b j ) 表示 A 与 B 的类间距离的平方,对
2
将所提取的特征记为IF特征。 应两类特征集合 {a i , i = 1, 2, · · · , k a } 和 {b i , i =
本文的分析频率范围为 50 Hz∼ f s /2,f s 为最 1, 2, · · · , k b },其中 a i ∈ A 类,b i ∈ B 类,计算公式
终采样频率,对于数据集1 f s = 4960 Hz,对于数据 如下:
集2 f s = 16 kHz。滤波器的个数为 40,特征维数为 k a k b
2 1 ∑ ∑ 2
d ({a i }, {b j }) = d (a i , b j ). (17)
13。滤波器组的中心频率分布选择线性尺度和 Mel K a K b
i=1 j=1
尺度两种。
d ({a i }, {a i }) 为类内距离的平方,对于某一类特征
2
3.2 对数能量 集合{a i , i = 1, 2, · · · , k}, 定义为
k
k
信号的短时能量用来度量其幅值变化,定义为 1 ∑ ∑
2
2
d ({a i }, {a i }) = d (a i , a j ).
加窗声信号区域的振幅绝对值的平方和。其表达式 K(K − 1)
i=1 j=1
如下: (18)
n
∑ 2 通常J A,B 越大,类别间可分性越好;J A,B 越小,其可
E n = [x(m)w(n − m)] , (14)
分性越差。
m=n−(N−1)
耳蜗滤波器的带宽会影响到IF特征的提取,带
其中,E n 是短时能量,x(m) 是待分析的车辆噪声信
宽过窄,会遗漏重要频率成分;带宽过宽,会影响
号,w(n) 是窗函数,N 是窗长。当窗函数为矩形窗
到瞬时频率估计,如何选择合适的带宽是需要进一
时,短时能量描述如下:
步研究的问题。根据上文描述,其带宽可以通过 β
n
∑
2
E n = x (m). (15) 值调节,β 值通常取 0.035 或 0.2。本节通过实验来
m=n−(N−1) 研究特征的可分性,其中 IF 特征是在 Mel 尺度下