Page 162 - 《应用声学》2025年第1期
P. 162
158 2025 年 1 月
图 1 展示了每一个一维卷积块的设计, 应 其中,a ∈ R 负责控制负半轴的斜率,同时其也是一
用了残差路径 (residual path) 和跳连通道 (skip- 个可学习的参数。
connection path):一个块的 residual path 用作下 网络中归一化方法的选择取决于因果关系的
一个块的输入,所有块的 skip-connection path 相 要求。对于非因果构成,基于前人经验选用全局归
加作为 TCN 的输出。同时为了减少参数量,在每 一化(gLN),在gLN中,特征在通道和时间维度上都
个卷积块中使用深度可分离卷积 (S-conv(·)) 代替 被归一化:
标准卷积。深度可分离卷积将标准卷积解耦为两 F − E[f]
gLN(F) = √ ⊙ γ + β, (11)
个连续的运算,即深度卷积 (D-conv(·)) 和点卷积 Var[F] + ε
(1 × 1-conv(·)): 1 ∑
E[F] = F, (12)
NT
D-conv(Y , K) = concat(y j ⊗ k j ), NT
1 ∑ 2
Var[F] = (F − E[F]) , (13)
j = 1, · · · , N, (8) NT
NT
S-conv(Y , K, L) = D-conv(Y , K) ⊗ L, (9) N×T N×1
其中,F ∈ R 为特征,γ、β ∈ R 为可训练参
其中,Y ∈ R G×M 作为 S-conv(·) 的输入,K ∈ 数,ε 为常数。在因果构成中,这需要将 gLN 改进为
R G×P 为 大 小 为 P 的 卷 积 核, y j ∈ R 1×M 以 及 cLN:
k j ∈ R 1×P 分别为矩阵 Y 和 K 的行,L ∈ R G×H×1 f k − E[f t6k ]
cLN(f k ) = √ ⊙ γ + β, (14)
为大小为1的卷积核,⊗表示卷积运算。其目的是使 Var[f t6k ] + ε
得将 D-conv(·) 运算对输入 Y 的每一行与对应的矩 1 ∑
E[f t6k ] = f t6k , (15)
阵 K 的行进行卷积,1×1-conv 块对特征空间进行 Nk Nk
线性变换。 Var[f t6k ] = 1 ∑ (f t6k − E[f t6k ]) , (16)
2
Nk
Nk
Input
其中 f k ∈ R N×1 是特征 F 中第 k 帧,f t6k ∈ R N×K
1T1-conv
对应为第 k 帧的特征 [f 1 , · · · , f k ] 以及 γ、β ∈ R N×1
PReLU 是适用于所有帧的可训练参数。为了确保分离模块
对输入的缩放不变,所选归一化方法应用于编码器
Normalization
输出ω,然后将其传递给分离模块。
D-conV
2 实验设计
PReLU
Normalization 训练的数据集由仿真生成,分别为干净信号、
带噪信号以及噪声。干净信号主要由CW、LFM、双
1T1-conv 1T1-conv
曲调频 (Hyperbolic frequency modulation, HFM)
信号组成。仿真过程中,移动声源发射信号,声源
Skip-connection Output
深度为 10∼100 m 范围内随机挑选。每种信号仿真
图 1 一维卷积块的设计
6 组,每组信号频率为在 10∼100 Hz 范围内随机生
Fig. 1 1-d Conv block design
成 3 个频率的信号。使用 32 元垂直阵接收信号,垂
在第一个1×1-conv和D-conv块之后分别加入 直阵采用坐底阵布放,在水平距离 15 km 范围内每
激活函数和归一化操作,激活函数选取参数校正线 10 m 布放一个垂直阵,来模拟移动发射。噪声类型
性单元(PReLU): 为高斯白噪声、舰船噪声等。总共仿真 400 h 的信
号,其中 360 h 作为训练数据,40 h 作为验证数据。
x, if x > 0,
PReLU (10) 同时使用真实的海试数据作为测试集。训练验证数
ax, 其他,
据采样率为8 kHz。