Page 28 - 《应用声学》2021年第4期
P. 28

512                                                                                  2021 年 7 月


                 (1) 利用 GFB 对原始底质信号进行滤波后得                          (3) 对步骤 (2) 中计算所得到的所有子带信号
             到一组数目与GFB通道数目相同的子带信号;                             能量集 E进行对数运算,得到原始底质信号的GFB
                 (2) 取长度为 M 的窗口在每一条子带信号上                       时频谱。
             以步长为 K(K<M) 进行平移,每次移动结束时利
                        √                                                     Gammatone
                           1  ∑ M   2
             用公式 e =               x (x i 为窗口内的子带信                              ໚ฉ٨ጸ
                                    i
                          M     i=1
             号) 计算窗口内的子带信号能量,最后得到所有子                                             ᤰ᥋1         ᫂ए˞Mረү൦
                                                                                             ᫂˞K(K< M)
             带信号能量集E;                                                                         ᝠካቔ԰Яߕ
                                                                                              ࣜηՂᑟ᧚
                     0
                                                                                 ᤰ᥋2
                   -5
                                                                    ηՂ                        ߕࣜηՂᬷ
                  -10                                                             . . .            ߕࣜηՂ
                 ໚ฉ٨־ऄ/dB  -15                                                  ᤰ᥋N             20lg E
                                                                                                   ᑟ᧚ᬷE
                  -20
                  -25
                  -30                                                                           ௑ᮠ៨
                                                                           图 2  GFB 时频谱计算流程
                  -35
                                                                  Fig. 2 GFB time-frequency spectrum calculation
                  -40
                                 10 1              10 2
                                                                  processs
                                   ᮠဋ/Hz
                      (a) 64ᤰ᥋˗ॷᮠဋ50~128 Hz௑Gammatone
                             ໚ฉ٨ጸࣨᮠ־ऄ                          2 CNN
                   130
                                              ᤰ᥋஝              2.1  CNN介绍
                   120
                                                 16
                                                 32
                   110                                             CNN  [17]  是一种主要包含卷积层 (含激励操
                                                 64
                                                 128           作)、池化层和全连接层的深度学习结构,通过
                   100
                  ᮠဋ/Hz  90                                    卷积、激活和池化操作自动学习提取图像特征后利
                                                 256
                    80
                                                               用全连接层输出分类结果达到最终的分类目的。
                    70
                                                                   卷积层主要是由若干个卷积核组成,通过卷积
                    60
                                                               操作能够提取输入信息的不同层次特征,随着卷积
                    50
                      0   50   100   150  200  250  300        层深度的增加,CNN 越注重提取更深层次的特征,
                                   ᤰ᥋ऀՂ
                     (b) ˀՏᤰ᥋஝௑Պᤰ᥋˗ॷᮠဋښERB۫ʽᄊԫӑ                最后卷积结果通过激励层得到特征图。所有卷积层
                                                               通过 BP 算法进行权重更新进而实现整个 CNN 模
                                  f  =128 Hz
                                                               型的优化,卷积层操作表达式如下:
                                  f  =110 Hz
                                                                        
                                                                                ∑
                                                                           l
                                                                                                  l
                                                                         x =       x l−1  ∗ k l mn  + b ,
                                                                        
                                                                                                  n
                                                                                      m
                                                                           n
                                  f  =90 Hz                                                              (3)
                                                                               m∈P n
                                                                        
                                                                                  l
                                                                           l
                                                                          y = f(x ),
                                  f =70 Hz                                n      n
                                                                      l
                                                               其中,x 为卷积层 l 第 n 个通道的输出,P n 为卷积
                                                                      n
                                  f  =50 Hz
                                                               层l 的输入特征图集(卷积层l−1的输出特征图集),
                                                               x l−1  为第l − 1 卷积层的输出特征图,k         l mn  为卷积核
                                                                m
                     0     0.05  0.10  0.15   0.20  0.25
                                                                          l
                                   ௑ᫎ/s                        权重矩阵,b 为偏置。f(·) 为激励函数,本质上是
                                                                          n
                           (c) ˀՏ˗ॷᮠဋ௑GTF௑۫ฉॎ                  对卷积层输出进行一次非线性映射                  [18] ,增加整个
                                                               CNN 模型的非线性特性,常用的激励函数有 ReLU
                图 1  GFB 不同通道数和中心频率时的波形变化
                                                               函数、sigmoid 函数、tanh 函数以及 softplus 函数,4
               Fig. 1 GFB waveforms in different channel num-
               bers and center frequencies                     种激励函数图像如图3 所示。
   23   24   25   26   27   28   29   30   31   32   33