Page 152 - 《应用声学》2021年第3期
P. 152
470 2021 年 5 月
的能量取对数,最后进行离散余弦变换即可得 一个任意的连续非线性函数,因此,本文采用单
到 MFCC [10] 。 这里取其前 12 阶系数 MFCC 1 ∼ 隐层的 BP 神经网络。隐含层节点数也会影响网
MFCC 12 进行分析。在进行 MFCC 计算时,声信 络的预测精度,其确定方法主要依靠经验法或
号分帧及窗函数须保持与提取其他特征参数时相 试凑法 [12] 。隐含层的激励函数选取 Sigmoid 函数:
一致。 f(x) = 1/(1 + e −x )。为了解决神经网络预测误差
在修正过程中没有考虑到网络模型自身学习经验
2 分类识别模型构建 的积累且学习收敛速度相对较为缓慢的问题,本文
采用附加动量法进行计算。为了在网络学习过程中
2.1 实验数据采集
使网络逐渐趋于稳定,本文采用变学习率方法进行
在苏州市虎丘区贡山路和渚镇路、杭州市江干
计算。
区五一路和西宁市城北区美丽水街进行了数据采
集,测试道路均为沥青混凝土路面,双向两车道路 ᬥ ᣥ ᝠ ి Ѽல
Ꭺ ե ѣ ካ ϙ ᣥѣ ߹
段。各路段两侧有较矮的树木,周围无高大建筑物、 ፏ ࡏ ࡏ Ꭺ ֗ ፇ౧ ௧ ੇ
Ѻ ᣥ ᣥ ፏ ឨࣀ ᝫ
无其他明显噪声源影响,没有其他大型反射物或吸 ݽ ѣ ѣ ᮕ ϙ ௧ա ա ጷ
ӑ ᝠ ᝠ ఞ ҂
声材料。测试路段符合背景噪声较小、路况良好等 ካ ካ ឨ ழ ᮕర
ࣀ ϙ
车辆通过声信号的测试要求。
车辆声音信号采集系统包括传声器、采集器和
图 1 BP 神经网络训练过程
电脑。采集器为 INV3062A 多通道网络分布式采集
Fig. 1 BP neural network training process
分析仪。测试时声信号的采样频率为 51.2 kHz。为
主成分分析 (PCA) 方法力求在数据信息损失
了确定样本车辆通过时的速度范围,在测试路段现
最小的原则下,将多维数据变量指标转换成相对较
场架置高速摄像机进行与声信号采集同步拍摄。速
少维的综合指标,转化后的综合指标成为“主成分”。
度测试区间宽度3 m,车辆通过时间较短,故认为车
通过特征提取后,获得的特征向量间可能会含有冗
辆在测试区间段匀速通过。噪声测试点距离道路中
余数据而导致特征匹配时计算量过大且复杂,计算
心线 7.5 m。测试时,按照标准《汽车加速行驶车外
时间较长。本文采用 PCA 方法对特征向量进行降
噪声限值及测量方法》进行测试 [11] 。
维处理,将获取到的新的主成分变量作为 BP 神经
现场采集数据为小型车及公交车通过标记路
网络的输入端参数输入,将此方法简称为 PCA-BP
段时的声信号以及速度范围。声音信号样本包含81
方法。
个,其中小型车60个,公交车21个。
主成分分析基本步骤主要包括以下几点:
2.2 应 用 PCA-BP 方 法 车 型 与 车 速 识 别 模 型 (1) 通过对相关程度的检验确定数据是否可用
构建
主成分分析。
BP 神经网络算法是人工神经网络中的一种, (2) 求主成分。一般数据变量之间有不同的单
属于监督式训练。该算法因为在理论上可以逼近任 位或者差异很大时,选择用基于相关系数矩阵的主
意函数而具有非常强大的非线性映射能力。在本文 成分分析方法,否则应考虑选择基于协方差阵的主
的研究中,将声信号的特征向量作为网络的输入层, 成分分析 [13] 。
通过建立从特征向量到车型与车速类别空间的非 (3) 计算出相关系数矩阵 (或者协方差阵) 的特
线性映射,实现车辆类型与速度的分类识别。 征根以及与特征根对应的特征向量。
识别前,首先要对 BP 神经网络的模型进行训 (4) 根据主成分的累计贡献率、特征根等确定
练。经过训练调整后的网络有了一定的联想记忆能 主成分的个数。其中,累计贡献率是指将前几个主
力和预测分类的能力。选取若干个样本作为训练集, 成分的方差求和后占总方差的比例,实际应用中可
然后进行BP神经网络训练。训练过程如图1所示。 以根据具体问题选取主成分个数。
BP 神经网络的输入层节点数主要由输入向 通过前期研究计算得到每个车辆声信号的短
量的维数决定。单隐层的 BP 神经网络可以逼近 时平均能量特征向量 1 维、短时平均过零率 1 维、