Page 152 - 《应用声学》2021年第3期
P. 152

470                                                                                  2021 年 5 月


             的能量取对数,最后进行离散余弦变换即可得                              一个任意的连续非线性函数,因此,本文采用单
             到 MFCC   [10] 。 这里取其前 12 阶系数 MFCC 1 ∼             隐层的 BP 神经网络。隐含层节点数也会影响网
             MFCC 12 进行分析。在进行 MFCC 计算时,声信                      络的预测精度,其确定方法主要依靠经验法或
             号分帧及窗函数须保持与提取其他特征参数时相                             试凑法    [12] 。隐含层的激励函数选取 Sigmoid 函数:
             一致。                                               f(x) = 1/(1 + e −x )。为了解决神经网络预测误差
                                                               在修正过程中没有考虑到网络模型自身学习经验
             2 分类识别模型构建                                        的积累且学习收敛速度相对较为缓慢的问题,本文

                                                               采用附加动量法进行计算。为了在网络学习过程中
             2.1 实验数据采集
                                                               使网络逐渐趋于稳定,本文采用变学习率方法进行
                 在苏州市虎丘区贡山路和渚镇路、杭州市江干
                                                               计算。
             区五一路和西宁市城北区美丽水街进行了数据采
             集,测试道路均为沥青混凝土路面,双向两车道路                                     ᬥ     ᣥ     ᝠ    ి     Ѽல
                                                                  Ꭺ     ե     ѣ     ካ    ϙ     ᣥѣ        ߹
             段。各路段两侧有较矮的树木,周围无高大建筑物、                              ፏ     ࡏ     ࡏ     Ꭺ    ֗     ፇ౧     ௧  ੇ
                                                                  Ѻ     ᣥ     ᣥ     ፏ    ᫠     ឨࣀ        ᝫ
             无其他明显噪声源影响,没有其他大型反射物或吸                               ݽ     ѣ     ѣ     ᮕ    ϙ     ௧ա   ա    ጷ
                                                                  ӑ     ᝠ     ᝠ     ฾    ఞ     ᣺҂
             声材料。测试路段符合背景噪声较小、路况良好等                                     ካ     ካ     ឨ    ழ     ᮕర
                                                                                    ࣀ           ϙ
             车辆通过声信号的测试要求。
                 车辆声音信号采集系统包括传声器、采集器和
                                                                           图 1  BP 神经网络训练过程
             电脑。采集器为 INV3062A 多通道网络分布式采集
                                                                     Fig. 1 BP neural network training process
             分析仪。测试时声信号的采样频率为 51.2 kHz。为
                                                                   主成分分析 (PCA) 方法力求在数据信息损失
             了确定样本车辆通过时的速度范围,在测试路段现
                                                               最小的原则下,将多维数据变量指标转换成相对较
             场架置高速摄像机进行与声信号采集同步拍摄。速
                                                               少维的综合指标,转化后的综合指标成为“主成分”。
             度测试区间宽度3 m,车辆通过时间较短,故认为车
                                                               通过特征提取后,获得的特征向量间可能会含有冗
             辆在测试区间段匀速通过。噪声测试点距离道路中
                                                               余数据而导致特征匹配时计算量过大且复杂,计算
             心线 7.5 m。测试时,按照标准《汽车加速行驶车外
                                                               时间较长。本文采用 PCA 方法对特征向量进行降
             噪声限值及测量方法》进行测试              [11] 。
                                                               维处理,将获取到的新的主成分变量作为 BP 神经
                 现场采集数据为小型车及公交车通过标记路
                                                               网络的输入端参数输入,将此方法简称为 PCA-BP
             段时的声信号以及速度范围。声音信号样本包含81
                                                               方法。
             个,其中小型车60个,公交车21个。
                                                                   主成分分析基本步骤主要包括以下几点:
             2.2 应 用 PCA-BP 方 法 车 型 与 车 速 识 别 模 型                  (1) 通过对相关程度的检验确定数据是否可用
                  构建
                                                               主成分分析。
                 BP 神经网络算法是人工神经网络中的一种,                             (2) 求主成分。一般数据变量之间有不同的单
             属于监督式训练。该算法因为在理论上可以逼近任                            位或者差异很大时,选择用基于相关系数矩阵的主
             意函数而具有非常强大的非线性映射能力。在本文                            成分分析方法,否则应考虑选择基于协方差阵的主
             的研究中,将声信号的特征向量作为网络的输入层,                           成分分析     [13] 。
             通过建立从特征向量到车型与车速类别空间的非                                 (3) 计算出相关系数矩阵 (或者协方差阵) 的特
             线性映射,实现车辆类型与速度的分类识别。                              征根以及与特征根对应的特征向量。
                 识别前,首先要对 BP 神经网络的模型进行训                            (4) 根据主成分的累计贡献率、特征根等确定
             练。经过训练调整后的网络有了一定的联想记忆能                            主成分的个数。其中,累计贡献率是指将前几个主
             力和预测分类的能力。选取若干个样本作为训练集,                           成分的方差求和后占总方差的比例,实际应用中可
             然后进行BP神经网络训练。训练过程如图1所示。                           以根据具体问题选取主成分个数。
                 BP 神经网络的输入层节点数主要由输入向                              通过前期研究计算得到每个车辆声信号的短
             量的维数决定。单隐层的 BP 神经网络可以逼近                           时平均能量特征向量 1 维、短时平均过零率 1 维、
   147   148   149   150   151   152   153   154   155   156   157