Page 215 - 《应用声学)》2023年第5期
P. 215

第 42 卷 第 5 期             侯晓飞等: 基于子频带能量特征提取的汽车鸣笛声识别                                         1107


                                                               笛声的时频谱特征进行分析与提取,结合可变学习
             0 引言
                                                               速率的 BP 神经网络进行鸣笛声识别,可对不同车
                 近年来,城市中违法乱鸣笛行为随着汽车数量                          型的鸣笛声进行有效区分,获取违法鸣笛车辆的完
             的增加而逐渐增多。鸣笛声制造交通噪声的同时,                            整声学信息,以作为违法鸣笛的辅助判断和处罚依
             给人们的生产和生活也带来了巨大的影响,尤其是                            据。利用车辆的鸣笛声特征对鸣笛车辆车型进行识
             在学校、医院、居民区等这些需要安静的区域。因此,                          别分类,其目的是在违法鸣笛声治理过程中进行辅
             对乱鸣笛行为的治理非常有必要。车辆的识别与分                            助监管与判断,当有异议时,可通过复核对比鸣笛声
             类在创建城市智能交通系统中至关重要,在传统的                            定位与鸣笛声车型特征两种依据进行更加科学准
             鸣笛声识别分类中往往采用的是人工监测的方法,                            确的判断,从而减少鸣笛噪声,对道路交通噪声污染
             此种方法误检率较高,且依赖人工复核。目前车辆                            治理具有积极意义。
             识别与分类研究主要集中于视觉方法,对车辆完整
             的声学识别与分类研究较少。                                     1 鸣笛声特征提取与分类方法
                 随着声学研究的深入,为了提高鸣笛声的检测
                                                               1.1  鸣笛声特征提取
             效率,在鸣笛声分类识别方面,能量阈值法、互谱
             矩阵法以及特征提取法等逐渐被应用在鸣笛声识                                 城市道路中比较常见的鸣笛声是由电喇叭发
                                                               出的   [9] ,因此在研究时以小汽车上装载的电喇叭
             别当中,例如刘建平等          [1]  根据信号短时能量与过零
             率乘积的双门限检测算法对鸣笛声与非鸣笛声进                             发出的鸣笛声为主,主要频率集中在 400~5000 Hz
             行了识别;孙懋珩等         [2]  提出了一种基于传声器阵列               之间。
             和闭式球形插值法的汽车鸣笛声识别系统,但是此                                进一步将鸣笛声信号做短时傅里叶变换得到

             种方法只能单方面地确定目标车辆的位置,且会存                            鸣笛声的时频图,如图1所示。
             在较多误判。神经网络近些年受到了研究者越来                                 进行鸣笛声识别分类之前,需要对采集到的声
             越多的重视,侍艳华等          [3]  设计了梅尔频率倒谱系数              音样本进行有效声音段截取以保留鸣笛声信号的
             (Mel-frequency cepstrum coefficient, MFCC) 和卷       主要频率。采用短时能量法              [10]  确定鸣笛声信号有
             积神经网络识别鸣笛声的方法;班琦等                  [4]  在建立鸣      效声音段,短时能量法计算式如(1)所示:
             笛声样本的基础上利用改进的 BP 神经网络算法识                                             (1+K)N
                                                                                    ∑         2
             别了鸣笛声;白琳等         [5]  将小波变换   [6]  与 BP 神经网                   E K =        [x (i)] ,        (1)
             络相结合实现了车辆声信号的分类。                                                     i=KN+1
                 在鸣笛声识别分类中,利用神经网络识别时效                          式 (1) 中,x (i) 为传声器采集测量信号,E K 为第 K
             率与准确率会受到不同特征提取的影响,例如郑                             帧的短时能量。
             皓  [7]  将频谱特征作为卷积深度置信网络 (Convolu-                     为了进一步对鸣笛声进行分析,并将不同的鸣
             tional deep belief networks, CDBN) 的输入进行训         笛声分类,采用子频带能量法提取特征的方法进行
             练后得到鸣笛声的CDBN特征,与MFCC特征进行                          鸣笛声识别。通过划分声信号频谱子频带,对子频
             对比分析后发现利用 CDBN 特征进行识别的准确                          带内的频率信息进行分析,找出鸣笛声信号在各个
             率更高。可知鸣笛声识别中提取何种特征进行识别                            子频带与其他声音不同的特征,即可利用此种特征
             仍是一项关键。                                           进行鸣笛声识别。
                 在违法鸣笛声监管过程中通常利用传声器阵                               首先将鸣笛声的全频带进行划分,划分为N 个
             列进行鸣笛声定位         [8] ,但随着距离的增加,可能会                子频带。在对鸣笛声频带进行划分时,为了减小计
             产生定位误差,而两辆车如果并排行驶且横向距离                            算量,并将鸣笛声信号的子频带能量特征完整提取,
             较近时,由于定位误差的存在,可能会存在车辆之                            可将信号划分为 32 个子频带。为了保证各频率能
             间的误判。为了更准确地识别违法鸣笛声,提高交                            量不被泄漏,相邻两个子频带之间的重合度为50%。
             通执法效率,本文提出了一种基于子频带能量特征                            每一段子频带上能量初始值等于时频图能量值,如
             提取的汽车鸣笛声识别与分类的方法。本方法对鸣                            式(2)所示:
   210   211   212   213   214   215   216   217   218   219   220