Page 215 - 《应用声学)》2023年第5期
P. 215
第 42 卷 第 5 期 侯晓飞等: 基于子频带能量特征提取的汽车鸣笛声识别 1107
笛声的时频谱特征进行分析与提取,结合可变学习
0 引言
速率的 BP 神经网络进行鸣笛声识别,可对不同车
近年来,城市中违法乱鸣笛行为随着汽车数量 型的鸣笛声进行有效区分,获取违法鸣笛车辆的完
的增加而逐渐增多。鸣笛声制造交通噪声的同时, 整声学信息,以作为违法鸣笛的辅助判断和处罚依
给人们的生产和生活也带来了巨大的影响,尤其是 据。利用车辆的鸣笛声特征对鸣笛车辆车型进行识
在学校、医院、居民区等这些需要安静的区域。因此, 别分类,其目的是在违法鸣笛声治理过程中进行辅
对乱鸣笛行为的治理非常有必要。车辆的识别与分 助监管与判断,当有异议时,可通过复核对比鸣笛声
类在创建城市智能交通系统中至关重要,在传统的 定位与鸣笛声车型特征两种依据进行更加科学准
鸣笛声识别分类中往往采用的是人工监测的方法, 确的判断,从而减少鸣笛噪声,对道路交通噪声污染
此种方法误检率较高,且依赖人工复核。目前车辆 治理具有积极意义。
识别与分类研究主要集中于视觉方法,对车辆完整
的声学识别与分类研究较少。 1 鸣笛声特征提取与分类方法
随着声学研究的深入,为了提高鸣笛声的检测
1.1 鸣笛声特征提取
效率,在鸣笛声分类识别方面,能量阈值法、互谱
矩阵法以及特征提取法等逐渐被应用在鸣笛声识 城市道路中比较常见的鸣笛声是由电喇叭发
出的 [9] ,因此在研究时以小汽车上装载的电喇叭
别当中,例如刘建平等 [1] 根据信号短时能量与过零
率乘积的双门限检测算法对鸣笛声与非鸣笛声进 发出的鸣笛声为主,主要频率集中在 400~5000 Hz
行了识别;孙懋珩等 [2] 提出了一种基于传声器阵列 之间。
和闭式球形插值法的汽车鸣笛声识别系统,但是此 进一步将鸣笛声信号做短时傅里叶变换得到
种方法只能单方面地确定目标车辆的位置,且会存 鸣笛声的时频图,如图1所示。
在较多误判。神经网络近些年受到了研究者越来 进行鸣笛声识别分类之前,需要对采集到的声
越多的重视,侍艳华等 [3] 设计了梅尔频率倒谱系数 音样本进行有效声音段截取以保留鸣笛声信号的
(Mel-frequency cepstrum coefficient, MFCC) 和卷 主要频率。采用短时能量法 [10] 确定鸣笛声信号有
积神经网络识别鸣笛声的方法;班琦等 [4] 在建立鸣 效声音段,短时能量法计算式如(1)所示:
笛声样本的基础上利用改进的 BP 神经网络算法识 (1+K)N
∑ 2
别了鸣笛声;白琳等 [5] 将小波变换 [6] 与 BP 神经网 E K = [x (i)] , (1)
络相结合实现了车辆声信号的分类。 i=KN+1
在鸣笛声识别分类中,利用神经网络识别时效 式 (1) 中,x (i) 为传声器采集测量信号,E K 为第 K
率与准确率会受到不同特征提取的影响,例如郑 帧的短时能量。
皓 [7] 将频谱特征作为卷积深度置信网络 (Convolu- 为了进一步对鸣笛声进行分析,并将不同的鸣
tional deep belief networks, CDBN) 的输入进行训 笛声分类,采用子频带能量法提取特征的方法进行
练后得到鸣笛声的CDBN特征,与MFCC特征进行 鸣笛声识别。通过划分声信号频谱子频带,对子频
对比分析后发现利用 CDBN 特征进行识别的准确 带内的频率信息进行分析,找出鸣笛声信号在各个
率更高。可知鸣笛声识别中提取何种特征进行识别 子频带与其他声音不同的特征,即可利用此种特征
仍是一项关键。 进行鸣笛声识别。
在违法鸣笛声监管过程中通常利用传声器阵 首先将鸣笛声的全频带进行划分,划分为N 个
列进行鸣笛声定位 [8] ,但随着距离的增加,可能会 子频带。在对鸣笛声频带进行划分时,为了减小计
产生定位误差,而两辆车如果并排行驶且横向距离 算量,并将鸣笛声信号的子频带能量特征完整提取,
较近时,由于定位误差的存在,可能会存在车辆之 可将信号划分为 32 个子频带。为了保证各频率能
间的误判。为了更准确地识别违法鸣笛声,提高交 量不被泄漏,相邻两个子频带之间的重合度为50%。
通执法效率,本文提出了一种基于子频带能量特征 每一段子频带上能量初始值等于时频图能量值,如
提取的汽车鸣笛声识别与分类的方法。本方法对鸣 式(2)所示: