Page 152 - 《应用声学》2021年第3期

P. 152

470 2021 年 5 月

的能量取对数，最后进行离散余弦变换即可得一个任意的连续非线性函数，因此，本文采用单
到 MFCC [10] 。这里取其前 12 阶系数 MFCC 1 ∼ 隐层的 BP 神经网络。隐含层节点数也会影响网
MFCC 12 进行分析。在进行 MFCC 计算时，声信络的预测精度，其确定方法主要依靠经验法或
号分帧及窗函数须保持与提取其他特征参数时相试凑法 [12] 。隐含层的激励函数选取 Sigmoid 函数：
一致。 f(x) = 1/(1 + e −x )。为了解决神经网络预测误差
在修正过程中没有考虑到网络模型自身学习经验
2 分类识别模型构建的积累且学习收敛速度相对较为缓慢的问题，本文

采用附加动量法进行计算。为了在网络学习过程中
2.1 实验数据采集
使网络逐渐趋于稳定，本文采用变学习率方法进行
在苏州市虎丘区贡山路和渚镇路、杭州市江干
计算。
区五一路和西宁市城北区美丽水街进行了数据采
集，测试道路均为沥青混凝土路面，双向两车道路 ᬥ ᣥ ᝠ ి Ѽல
Ꭺ ե ѣ ካ ϙ ᣥѣ ߹
段。各路段两侧有较矮的树木，周围无高大建筑物、 ፏ ࡏ ࡏ Ꭺ ֗ ፇ౧ ௧ ੇ
Ѻ ᣥ ᣥ ፏ ᫠ ឨࣀ ᝫ
无其他明显噪声源影响，没有其他大型反射物或吸 ݽ ѣ ѣ ᮕ ϙ ௧ա ա ጷ
ӑ ᝠ ᝠ ฾ ఞ ᣺҂
声材料。测试路段符合背景噪声较小、路况良好等 ካ ካ ឨ ழ ᮕర
ࣀ ϙ
车辆通过声信号的测试要求。
车辆声音信号采集系统包括传声器、采集器和
图 1 BP 神经网络训练过程
电脑。采集器为 INV3062A 多通道网络分布式采集
Fig. 1 BP neural network training process
分析仪。测试时声信号的采样频率为 51.2 kHz。为
主成分分析 (PCA) 方法力求在数据信息损失
了确定样本车辆通过时的速度范围，在测试路段现
最小的原则下，将多维数据变量指标转换成相对较
场架置高速摄像机进行与声信号采集同步拍摄。速
少维的综合指标，转化后的综合指标成为“主成分”。
度测试区间宽度3 m，车辆通过时间较短，故认为车
通过特征提取后，获得的特征向量间可能会含有冗
辆在测试区间段匀速通过。噪声测试点距离道路中
余数据而导致特征匹配时计算量过大且复杂，计算
心线 7.5 m。测试时，按照标准《汽车加速行驶车外
时间较长。本文采用 PCA 方法对特征向量进行降
噪声限值及测量方法》进行测试 [11] 。
维处理，将获取到的新的主成分变量作为 BP 神经
现场采集数据为小型车及公交车通过标记路
网络的输入端参数输入，将此方法简称为 PCA-BP
段时的声信号以及速度范围。声音信号样本包含81
方法。
个，其中小型车60个，公交车21个。
主成分分析基本步骤主要包括以下几点：
2.2 应用 PCA-BP 方法车型与车速识别模型 (1) 通过对相关程度的检验确定数据是否可用
构建
主成分分析。
BP 神经网络算法是人工神经网络中的一种， (2) 求主成分。一般数据变量之间有不同的单
属于监督式训练。该算法因为在理论上可以逼近任位或者差异很大时，选择用基于相关系数矩阵的主
意函数而具有非常强大的非线性映射能力。在本文成分分析方法，否则应考虑选择基于协方差阵的主
的研究中，将声信号的特征向量作为网络的输入层，成分分析 [13] 。
通过建立从特征向量到车型与车速类别空间的非 (3) 计算出相关系数矩阵 (或者协方差阵) 的特
线性映射，实现车辆类型与速度的分类识别。征根以及与特征根对应的特征向量。
识别前，首先要对 BP 神经网络的模型进行训 (4) 根据主成分的累计贡献率、特征根等确定
练。经过训练调整后的网络有了一定的联想记忆能主成分的个数。其中，累计贡献率是指将前几个主
力和预测分类的能力。选取若干个样本作为训练集，成分的方差求和后占总方差的比例，实际应用中可
然后进行BP神经网络训练。训练过程如图1所示。以根据具体问题选取主成分个数。
BP 神经网络的输入层节点数主要由输入向通过前期研究计算得到每个车辆声信号的短
量的维数决定。单隐层的 BP 神经网络可以逼近时平均能量特征向量 1 维、短时平均过零率 1 维、

147 148 149 150 151 152 153 154 155 156 157