Page 102 - 《应用声学》2020年第1期
P. 102
98 2020 年 1 月
(Support vector machine, SVM) 进行分类识别,实
0 引言 验表明,本文算法性能良好,有一定应用价值。
近年来,随着我国经济的迅速发展,全社会的 1 实验数据
汽车拥有量增加,从而导致了一系列的交通问题,例
如交通拥堵、交通事故。智能交通系统是缓解道路 实验数据一共包括两个数据集。数据集 1 来自
交通问题的有效方法,该系统能够合理地利用交通 DARPA /IXOs SensIT 项目的实验 [5] ,该数据包
资源,实现现有交通网络的高效率运转和信息化管 含两种军用车辆,即履带车 (AAV) 和重型轮式卡
车 (DW) 的声波、地震波和红外波数据。文中选取
理。车型分类技术在智能交通系统中占据了重要的
地位,正确地分类识别出车型对公路收费、交通监 声波数据进行车型分类实验,该声波数据的采样率
为 4960 Hz。为了保证实验的正确性,选取两类车
控指挥、车流量统计等方面有重大意义。目前,用于
型车次和采样点相同的数据,即AAV3 ∼ AAV11 和
车辆检测的技术有很多,例如感应线圈、视频图像
DW3 ∼ DW11的第51、52、53、54、55、56、58、59、60、
和微波等,它们都存在一定缺陷,感应线圈安装维护
61采样点,共180条数据,每条数据截取时长 3 s,其
不方便;视频图像易受光线和遮挡物影响;微波技术
中 AAV5 和 DW8 的第 53 采样点总时长只有 1.5 s,
主要用来检测而不是分类。车辆行驶时产生的噪声
分别用 AAV3 的第 42 采样点 DW12 的第 53 采样点
信号携带具有区分性的车型信息,可以用于车辆目
代替。
标的分类识别。基于声信号的车型分类技术属于被
数据集 2 是通过自主实验采集到的数据,采集
动分类技术,具有隐蔽性高、安全性好、成本低和安
时间为 2018 年 3 月到 6 月,地点位于西北工业大学
装方便等优势。因此该技术受到国内外研究者的广
长安校区东大路,通过录音设备录制了公共汽车、
泛关注。
小轿车、摩托车和卡车四种道路交通中常见车型行
实现该技术的关键之一是特征提取,目前声目
驶时产生的噪声信号。每类车型录制了120个样本,
标特征提取的研究主要包括两方面:一方面是基
共 480 个样本,所有样本均是在单一车辆行驶经过
于信号处理方法分析其时频结构并从中提取有效
的情况下收集的,采样频率为44.1 kHz,每条样本截
特征,例如,Aljaafreh 等 [1] 使用基于频谱分布和小
取的时长为 3 s,经分析发现,车辆噪声信号主要集
波包变换的方法提取特征用于车型分类;另一方面
中在低频范围,为了降低计算量,将样本采样频率降
是鉴于人的听觉系统在听音辨物方面优势,从人对
到 16 kHz。为了方便实验描述,将上述四种车型分
声音的听觉感知出发提取听觉特征,例如,陈克安
别记为A、B、C和D。
等 [2] 使用基于 Shamma 模型的听觉谱特性用于车
辆目标识别。这些特征大多是基于信号幅度谱的, 2 瞬时频率估计
而忽略了信号相位信息的重要性,主要原因是在
传统的语音信号处理中人们认为感知系统对相位 瞬时频率估计比较常用的方法是希尔伯特变
不敏感,然而近年来随着研究的深入,发现相位信 换法,该方法通过对信号进行希尔伯特变换求其解
息在语音识别方面也是重要的。Nakagawa 等 [3] 通 析信号,然后计算解析信号的瞬时幅度和相位信息,
过联合Mel频率倒谱系数(Mel frequency cepstrum 最后通过求解相位的一阶导数估计瞬时频率。
coefficient, MFCC) 特征和相位信息提高了说话人 能量有限实信号s(t)的解析信号定义为
识别的准确率,Paliwal 等 [4] 发现相位谱也能够像 s a (t) = s(t) + js h (t), (1)
幅度谱一样对语音清晰度做出贡献。
其中,s h (t)是信号s(t)的希尔伯特变换,通过S h (w)
鉴于此,本文利用相位的一阶导数瞬时频率
的傅里叶反变换得到
(Instantaneous frequency, IF) 来进行特征提取,使
用耳蜗滤波器组将车辆噪声信号分解成子带信号, +jS(jw), w < 0,
提出一种基于子带信号瞬时频率的特征提取方法, S h (w) = 0, w = 0, (2)
并将所提特征与对数能量结合,通过支持向量机 −jS(jw), w > 0.