Page 28 - 《应用声学》2021年第4期
P. 28
512 2021 年 7 月
(1) 利用 GFB 对原始底质信号进行滤波后得 (3) 对步骤 (2) 中计算所得到的所有子带信号
到一组数目与GFB通道数目相同的子带信号; 能量集 E进行对数运算,得到原始底质信号的GFB
(2) 取长度为 M 的窗口在每一条子带信号上 时频谱。
以步长为 K(K<M) 进行平移,每次移动结束时利
√ Gammatone
1 ∑ M 2
用公式 e = x (x i 为窗口内的子带信 ฉ٨ጸ
i
M i=1
号) 计算窗口内的子带信号能量,最后得到所有子 ᤰ᥋1 ᫂ए˞Mረү൦
᫂˞K(K< M)
带信号能量集E; ᝠካቔЯߕ
ࣜηՂᑟ᧚
0
ᤰ᥋2
-5
ηՂ ߕࣜηՂᬷ
-10 . . . ߕࣜηՂ
ฉ٨־ऄ/dB -15 ᤰ᥋N 20lg E
ᑟ᧚ᬷE
-20
-25
-30 ᮠ៨
图 2 GFB 时频谱计算流程
-35
Fig. 2 GFB time-frequency spectrum calculation
-40
10 1 10 2
processs
ᮠဋ/Hz
(a) 64ᤰ᥋˗ॷᮠဋ50~128 HzGammatone
ฉ٨ጸࣨᮠ־ऄ 2 CNN
130
ᤰ᥋ 2.1 CNN介绍
120
16
32
110 CNN [17] 是一种主要包含卷积层 (含激励操
64
128 作)、池化层和全连接层的深度学习结构,通过
100
ᮠဋ/Hz 90 卷积、激活和池化操作自动学习提取图像特征后利
256
80
用全连接层输出分类结果达到最终的分类目的。
70
卷积层主要是由若干个卷积核组成,通过卷积
60
操作能够提取输入信息的不同层次特征,随着卷积
50
0 50 100 150 200 250 300 层深度的增加,CNN 越注重提取更深层次的特征,
ᤰ᥋ऀՂ
(b) ˀՏᤰ᥋Պᤰ᥋˗ॷᮠဋښERB۫ʽᄊԫӑ 最后卷积结果通过激励层得到特征图。所有卷积层
通过 BP 算法进行权重更新进而实现整个 CNN 模
f =128 Hz
型的优化,卷积层操作表达式如下:
f =110 Hz
∑
l
l
x = x l−1 ∗ k l mn + b ,
n
m
n
f =90 Hz (3)
m∈P n
l
l
y = f(x ),
f =70 Hz n n
l
其中,x 为卷积层 l 第 n 个通道的输出,P n 为卷积
n
f =50 Hz
层l 的输入特征图集(卷积层l−1的输出特征图集),
x l−1 为第l − 1 卷积层的输出特征图,k l mn 为卷积核
m
0 0.05 0.10 0.15 0.20 0.25
l
ᫎ/s 权重矩阵,b 为偏置。f(·) 为激励函数,本质上是
n
(c) ˀՏ˗ॷᮠဋGTF۫ฉॎ 对卷积层输出进行一次非线性映射 [18] ,增加整个
CNN 模型的非线性特性,常用的激励函数有 ReLU
图 1 GFB 不同通道数和中心频率时的波形变化
函数、sigmoid 函数、tanh 函数以及 softplus 函数,4
Fig. 1 GFB waveforms in different channel num-
bers and center frequencies 种激励函数图像如图3 所示。