Page 14 - 201901
P. 14

10                                                                                   2019 年 1 月


             在多类应用中取得了突破性的进展                  [9] 。深度学习        语音识别     [10] 、声学场景分析     [11]  等众多研究和应用
             模拟人脑的分层工作机制,构建层次化的深度神经                            领域。
             网络,对输入数据逐层进行特征提取,得到分层的
             特征表示。深度神经网络通过监督或无监督学习                             2.1  总体框架
             优化数据的特征表征,有效地简化了特征提取的设                                本文采用一种并行结合 CNN 和 LSTM 的复
             计。本文所用于优化直升机声信号特征提取的卷                             合深度神经网络模型,如图 2 所示,利用 CNN 和
             积神经网络 (Convolutional neural network, CNN)         LSTM 并行地从声信号短时谱图中进一步提取局
             和长短时记忆神经网络 (Long short-term memory,               部时频信息和时序相关信息构造新的信号特征进
             LSTM) 是深度学习中的经典模型,已被广泛应用                          行分类。

                                                          Softmaxᣥѣࡏ



                                                           Лᤌଌࡏ
                                                               ྲढ़ᚸՌ


                                        LSTM                                        CNN
                                ᬥ                                             ෉ӑࡏ2
                                ᘩ ௑ᫎ൦       ௑ᫎ൦        ௑ᫎ൦
                                ࡏ   1        2          12
                                 2                                            Ԅሥࡏ2


                                ᬥ                                             ෉ӑࡏ1
                                ᘩ ௑ᫎ൦       ௑ᫎ൦        ௑ᫎ൦
                                ࡏ   1        2          12
                                 1                                            Ԅሥࡏ1







                              ᮠဋ/Hz


                                ௑ᫎ/s

                                                 图 2  复合深度神经网络模型
                                        Fig. 2 Structure of combined deep neural network

             2.2 卷积神经网络                                        练的卷积核与上一层特征图的局部区域连接,卷积
                                                               核是一个二维权值矩阵。特征图和卷积核维度可视
                 卷积神经网络是由多层卷积层和池化层交替
                                                               为频率 F 和时间 T。对于卷积层 l,输出特征图 X                  l
             连接组成的深度神经网络,具有局部连接、权值共
                                                               表示为    [13]
             享和池化操作三大特点           [12] 。卷积层从底层到高层
             逐步抽取输入数据的抽象特征。池化层将相似特征                                         l    (  l−1     l   l )
                                                                          X = A X      ∗ W + b ,          (1)
             融合,大大减少了模型参数,同时具有二次提取特征

             表示的功能,使特征对噪声和变形具有鲁棒性,保证                           其中,运算符号 “∗” 表示卷积操作;A 为激活函数;
             特征的平移不变性。                                         W 为卷积核;b 为加性偏置向量。
                                                                  l
                                                                             l
                 每个卷积层都包含多个特征图,特征图是由多                              池化层通常跟随在卷积层之后,依据一定的下
             个神经元构成的二维矩阵,每一个神经元通过可训                            采样规则对特征图进行下采样。对于池化层l,输出
   9   10   11   12   13   14   15   16   17   18   19