Page 162 - 《应用声学》2025年第1期
P. 162

158                                                                                  2025 年 1 月


                 图 1 展示了每一个一维卷积块的设计, 应                         其中,a ∈ R 负责控制负半轴的斜率,同时其也是一
             用了残差路径 (residual path) 和跳连通道 (skip-               个可学习的参数。
             connection path):一个块的 residual path 用作下               网络中归一化方法的选择取决于因果关系的
             一个块的输入,所有块的 skip-connection path 相                要求。对于非因果构成,基于前人经验选用全局归
             加作为 TCN 的输出。同时为了减少参数量,在每                          一化(gLN),在gLN中,特征在通道和时间维度上都
             个卷积块中使用深度可分离卷积 (S-conv(·)) 代替                     被归一化:
             标准卷积。深度可分离卷积将标准卷积解耦为两                                                 F − E[f]
                                                                       gLN(F) = √            ⊙ γ + β,    (11)
             个连续的运算,即深度卷积 (D-conv(·)) 和点卷积                                         Var[F] + ε
             (1 × 1-conv(·)):                                                     1  ∑
                                                                          E[F] =        F,               (12)
                                                                                 NT
                  D-conv(Y , K) = concat(y j ⊗ k j ),                                NT
                                                                                  1  ∑             2
                                                                        Var[F] =        (F − E[F]) ,     (13)
                                  j = 1, · · · , N,     (8)                      NT
                                                                                     NT
                S-conv(Y , K, L) = D-conv(Y , K) ⊗ L,   (9)               N×T                 N×1
                                                               其中,F ∈ R        为特征,γ、β ∈ R        为可训练参
             其中,Y ∈ R     G×M  作为 S-conv(·) 的输入,K ∈            数,ε 为常数。在因果构成中,这需要将 gLN 改进为
             R G×P  为 大 小 为 P 的 卷 积 核, y j ∈ R    1×M  以 及     cLN:
             k j ∈ R 1×P  分别为矩阵 Y 和 K 的行,L ∈ R      G×H×1                      f k − E[f t6k ]
                                                                    cLN(f k ) = √            ⊙ γ + β,    (14)
             为大小为1的卷积核,⊗表示卷积运算。其目的是使                                            Var[f t6k ] + ε
             得将 D-conv(·) 运算对输入 Y 的每一行与对应的矩                                    1  ∑
                                                                    E[f t6k ] =      f t6k ,             (15)
             阵 K 的行进行卷积,1×1-conv 块对特征空间进行                                     Nk  Nk

             线性变换。                                                 Var[f t6k ] =  1  ∑  (f t6k − E[f t6k ]) ,  (16)
                                                                                                    2
                                                                              Nk
                                                                                  Nk
                              Input
                                                               其中 f k ∈ R N×1  是特征 F 中第 k 帧,f t6k ∈ R    N×K
                             1T1-conv
                                                               对应为第 k 帧的特征 [f 1 , · · · , f k ] 以及 γ、β ∈ R N×1
                             PReLU                             是适用于所有帧的可训练参数。为了确保分离模块
                                                               对输入的缩放不变,所选归一化方法应用于编码器
                           Normalization
                                                               输出ω,然后将其传递给分离模块。
                              D-conV
                                                               2 实验设计
                              PReLU

                           Normalization                           训练的数据集由仿真生成,分别为干净信号、
                                                               带噪信号以及噪声。干净信号主要由CW、LFM、双
                        1T1-conv    1T1-conv
                                                               曲调频 (Hyperbolic frequency modulation, HFM)
                                                               信号组成。仿真过程中,移动声源发射信号,声源
                     Skip-connection       Output
                                                               深度为 10∼100 m 范围内随机挑选。每种信号仿真
                          图 1  一维卷积块的设计
                                                               6 组,每组信号频率为在 10∼100 Hz 范围内随机生
                       Fig. 1 1-d Conv block design
                                                               成 3 个频率的信号。使用 32 元垂直阵接收信号,垂
                 在第一个1×1-conv和D-conv块之后分别加入                    直阵采用坐底阵布放,在水平距离 15 km 范围内每
             激活函数和归一化操作,激活函数选取参数校正线                            10 m 布放一个垂直阵,来模拟移动发射。噪声类型
             性单元(PReLU):                                       为高斯白噪声、舰船噪声等。总共仿真 400 h 的信
                                                               号,其中 360 h 作为训练数据,40 h 作为验证数据。
                                
                                 x,  if x > 0,
                        PReLU                          (10)    同时使用真实的海试数据作为测试集。训练验证数
                                 ax,  其他,
                                
                                                               据采样率为8 kHz。
   157   158   159   160   161   162   163   164   165   166   167