Page 13 - 201901
P. 13
第 38 卷 第 1 期 郭洋等: 复合深度神经网络在直升机声目标识别中的研究 9
和时序相关信息的表征,以提高直升机飞行过程中
0 引言
声信号连续识别的鲁棒性和正确率。
声学探测根据目标自身噪声进行目标探测识
1 直升机声信号分析
别,具有全向探测无盲区、被动探测隐蔽性好等优
势,是目标识别的重要手段之一,可成为雷达、光 直升机飞行噪声主要来自旋翼、发动机等部件
学等传统目标探测方式的补充,提供更丰富的信息 的周期性运动及带动气流产生的气动噪声,其中旋
和更好的环境适应能力 [1−2] 。为了尽早发现目标, 翼是主要的噪声来源 [7] 。直升机从远处直线飞行经
并考虑到目标声信号的短时平稳性,现有的声目标 过测点再飞离这一完整飞行事件的声信号短时谱
识别通常采用声信号分帧处理的方法。借鉴声信号 图如图 1 所示,线谱噪声主要分布在 1.5 kHz 以下,
处理技术,人工设计特征提取方法获得每帧信号的 是主旋翼周期性运动产生的一系列谐频信号。
特征并进行识别,从而快速更新识别结果。特征提 基于声信号的直升机远距离连续探测识别中
取主要有以下两种思路:第一种是直接检测目标的 存在不利因素:直升机在测点附近时,宽带气动噪声
物理参数作为判别依据,如文献 [3] 检测直升机声 增强,导致直升机谐频信号的信噪比明显下降;直升
信号的基频及谐频的频率。该方法物理意义明确, 机高速运动导致的多普勒效应使声信号发生频移,
但在低信噪比条件下难以准确估计上述参数,不能 如图1 所示短时谱图上第 35 s 直升机经过测点上空
适应复杂的实际应用环境。第二种,也是主流的方 时谐频信号的频率出现整体下降;同时,在近场情况
法,通常是以各种信号处理或数据处理技术从直升 下多径传播导致直达声与反射声之间的相位差变
机声信号中抽象出特征再由分类器进行识别 [4] 。其 化明显,信号在某些频率上相互抵消或增强,短时谱
与第一种方法的主要区别在于信号特征与直升机 图中产生多个波谷、波峰 [8] 。这些波谷、波峰改变了
型号参数之间的物理关系不明确,需要通过分类器 部分线谱信号的信噪比,使声信号特征频率表征的
的训练建立信号特征与直升机型号之间的映射。传 连续性、稳定性受到干扰。
统的声信号特征提取在声信号分析处理基础上进 这些干扰,加上实际应用中风噪声等环境噪声
行优化,寻找能有效识别目标且维数尽量低的特征 的影响,使得直升机飞过测点的过程中目标连续识
表征方法。典型的声信号特征包括短时傅里叶频 别鲁棒性受到影响,往往不能连续正确识别。
谱特征、小波特征、线性预测倒谱系数等信号处理
1500
参数特征,以及 Mel 频率倒谱系数 (Mel-frequency
ceptral coefficients, MFCC) 等反映人类听觉特性
的声学特征等。 1000
近年来随着深度学习技术的快速发展,越来越
多的研究人员开始采用深度学习进行声目标识别 ᮠဋ/Hz
研究,并借助深度神经网络实现特征优化和目标识 500
别 [5−6] 。如文献 [6] 利用稀疏自编码器从声信号短
时傅里叶谱中提取浅层目标特征,再结合堆叠自编
0
码器从浅层目标特征中进一步提取更抽象的目标 5 10 15 20 25 30 35 40 45 50 55
ᫎ/s
特征用于水下目标识别,由此得到的识别正确率相
较于传统方法有显著提升。但这种利用深度学习的 图 1 直升机飞行经过测点过程的噪声短时谱图
方法与传统方法类似,仅利用了当前数据帧的特征 Fig. 1 Noise spectrogram of helicopter passing by
the detector
进行识别得到当前识别结果,实际使用中通常需要
后处理环节以利用时间历程信息减少虚警和漏警。
2 复合深度神经网络模型
本文在对直升机飞行噪声分析的基础上,利用
深度学习技术从直升机声信号短时谱图中自动进 深度学习技术具有强大的学习能力,能够描述
行特征提取和分类识别,优化信号的局部时频信息 输入数据与输出目标之间的高度非线性关系,已