Page 14 - 201901
P. 14
10 2019 年 1 月
在多类应用中取得了突破性的进展 [9] 。深度学习 语音识别 [10] 、声学场景分析 [11] 等众多研究和应用
模拟人脑的分层工作机制,构建层次化的深度神经 领域。
网络,对输入数据逐层进行特征提取,得到分层的
特征表示。深度神经网络通过监督或无监督学习 2.1 总体框架
优化数据的特征表征,有效地简化了特征提取的设 本文采用一种并行结合 CNN 和 LSTM 的复
计。本文所用于优化直升机声信号特征提取的卷 合深度神经网络模型,如图 2 所示,利用 CNN 和
积神经网络 (Convolutional neural network, CNN) LSTM 并行地从声信号短时谱图中进一步提取局
和长短时记忆神经网络 (Long short-term memory, 部时频信息和时序相关信息构造新的信号特征进
LSTM) 是深度学习中的经典模型,已被广泛应用 行分类。
Softmaxᣥѣࡏ
Лᤌଌࡏ
ྲढ़ᚸՌ
LSTM CNN
ᬥ ӑࡏ2
ᘩ ᫎ൦ ᫎ൦ ᫎ൦
ࡏ 1 2 12
2 Ԅሥࡏ2
ᬥ ӑࡏ1
ᘩ ᫎ൦ ᫎ൦ ᫎ൦
ࡏ 1 2 12
1 Ԅሥࡏ1
ᮠဋ/Hz
ᫎ/s
图 2 复合深度神经网络模型
Fig. 2 Structure of combined deep neural network
2.2 卷积神经网络 练的卷积核与上一层特征图的局部区域连接,卷积
核是一个二维权值矩阵。特征图和卷积核维度可视
卷积神经网络是由多层卷积层和池化层交替
为频率 F 和时间 T。对于卷积层 l,输出特征图 X l
连接组成的深度神经网络,具有局部连接、权值共
表示为 [13]
享和池化操作三大特点 [12] 。卷积层从底层到高层
逐步抽取输入数据的抽象特征。池化层将相似特征 l ( l−1 l l )
X = A X ∗ W + b , (1)
融合,大大减少了模型参数,同时具有二次提取特征
表示的功能,使特征对噪声和变形具有鲁棒性,保证 其中,运算符号 “∗” 表示卷积操作;A 为激活函数;
特征的平移不变性。 W 为卷积核;b 为加性偏置向量。
l
l
每个卷积层都包含多个特征图,特征图是由多 池化层通常跟随在卷积层之后,依据一定的下
个神经元构成的二维矩阵,每一个神经元通过可训 采样规则对特征图进行下采样。对于池化层l,输出