Page 13 - 201901
P. 13

第 38 卷 第 1 期            郭洋等: 复合深度神经网络在直升机声目标识别中的研究                                            9


                                                               和时序相关信息的表征,以提高直升机飞行过程中
             0 引言
                                                               声信号连续识别的鲁棒性和正确率。
                 声学探测根据目标自身噪声进行目标探测识
                                                               1 直升机声信号分析
             别,具有全向探测无盲区、被动探测隐蔽性好等优
             势,是目标识别的重要手段之一,可成为雷达、光                                直升机飞行噪声主要来自旋翼、发动机等部件
             学等传统目标探测方式的补充,提供更丰富的信息                            的周期性运动及带动气流产生的气动噪声,其中旋
             和更好的环境适应能力            [1−2] 。为了尽早发现目标,            翼是主要的噪声来源          [7] 。直升机从远处直线飞行经
             并考虑到目标声信号的短时平稳性,现有的声目标                            过测点再飞离这一完整飞行事件的声信号短时谱
             识别通常采用声信号分帧处理的方法。借鉴声信号                            图如图 1 所示,线谱噪声主要分布在 1.5 kHz 以下,
             处理技术,人工设计特征提取方法获得每帧信号的                            是主旋翼周期性运动产生的一系列谐频信号。
             特征并进行识别,从而快速更新识别结果。特征提                                基于声信号的直升机远距离连续探测识别中
             取主要有以下两种思路:第一种是直接检测目标的                            存在不利因素:直升机在测点附近时,宽带气动噪声
             物理参数作为判别依据,如文献 [3] 检测直升机声                         增强,导致直升机谐频信号的信噪比明显下降;直升
             信号的基频及谐频的频率。该方法物理意义明确,                            机高速运动导致的多普勒效应使声信号发生频移,
             但在低信噪比条件下难以准确估计上述参数,不能                            如图1 所示短时谱图上第 35 s 直升机经过测点上空
             适应复杂的实际应用环境。第二种,也是主流的方                            时谐频信号的频率出现整体下降;同时,在近场情况
             法,通常是以各种信号处理或数据处理技术从直升                            下多径传播导致直达声与反射声之间的相位差变
             机声信号中抽象出特征再由分类器进行识别                     [4] 。其    化明显,信号在某些频率上相互抵消或增强,短时谱
             与第一种方法的主要区别在于信号特征与直升机                             图中产生多个波谷、波峰           [8] 。这些波谷、波峰改变了

             型号参数之间的物理关系不明确,需要通过分类器                            部分线谱信号的信噪比,使声信号特征频率表征的
             的训练建立信号特征与直升机型号之间的映射。传                            连续性、稳定性受到干扰。
             统的声信号特征提取在声信号分析处理基础上进                                 这些干扰,加上实际应用中风噪声等环境噪声
             行优化,寻找能有效识别目标且维数尽量低的特征                            的影响,使得直升机飞过测点的过程中目标连续识
             表征方法。典型的声信号特征包括短时傅里叶频                             别鲁棒性受到影响,往往不能连续正确识别。
             谱特征、小波特征、线性预测倒谱系数等信号处理
                                                                    1500
             参数特征,以及 Mel 频率倒谱系数 (Mel-frequency
             ceptral coefficients, MFCC) 等反映人类听觉特性
             的声学特征等。                                                1000
                 近年来随着深度学习技术的快速发展,越来越
             多的研究人员开始采用深度学习进行声目标识别                                  ᮠဋ/Hz
             研究,并借助深度神经网络实现特征优化和目标识                                  500
             别  [5−6] 。如文献 [6] 利用稀疏自编码器从声信号短
             时傅里叶谱中提取浅层目标特征,再结合堆叠自编
                                                                      0
             码器从浅层目标特征中进一步提取更抽象的目标                                        5  10  15  20  25  30  35  40  45  50  55
                                                                                      ௑ᫎ/s
             特征用于水下目标识别,由此得到的识别正确率相
             较于传统方法有显著提升。但这种利用深度学习的                                图 1  直升机飞行经过测点过程的噪声短时谱图
             方法与传统方法类似,仅利用了当前数据帧的特征                               Fig. 1 Noise spectrogram of helicopter passing by
                                                                  the detector
             进行识别得到当前识别结果,实际使用中通常需要
             后处理环节以利用时间历程信息减少虚警和漏警。
                                                               2 复合深度神经网络模型
                 本文在对直升机飞行噪声分析的基础上,利用
             深度学习技术从直升机声信号短时谱图中自动进                                 深度学习技术具有强大的学习能力,能够描述
             行特征提取和分类识别,优化信号的局部时频信息                            输入数据与输出目标之间的高度非线性关系,已
   8   9   10   11   12   13   14   15   16   17   18