Page 130 - 《应用声学》2021年第1期
P. 130

126                                                                                  2021 年 1 月


             一层,随机将部分节点对应的权重值置零,使得线性                           收信号拷贝 100 份并分成 10组,每一组模拟接收信
             系数矩阵和偏置向量达到稀疏化的效果,在一定程                            号分别添加信噪比 (Signal-to-noise ratio, SNR) 为
             度上避免过拟合的问题。引入 Dropout 的神经网络                       1 dB、2 dB、3 dB、· · · 、10 dB的高斯噪声。接收点距
             描述由式(12)变为       [17] :                           离分布在 1 ∼ 10 km,深度是分布在 5 ∼ 145 m,网
                                                              络输入训练集占总样本集 80%,由 16080 个样本组
                      (l)
                     r    ∼ Bernoulli(p),
                      j
                                                              成,剩余 20% 的数据作为测试集,由 4020 个样本组
                     
                     
                      (l)    (l)  l
                       ˜ x  = r  · y ,
                                                       (19)    成。对生成样本进行多域特征提取,对每一帧得到
                      (l+1)  = w  (l+1) l  (l+1) ,
                                     y + b
                     x
                      i         i         i                   的特征序列求统计特征,得到均值和方差,对所有帧
                     
                     
                      (l+1)       (l+1)
                      y     = f(x     ),                      的自相关系数和频域特征序列求统计特征,得到所
                        i          i
                                                               有帧的时间均值和时间方差。最终提取到 20100 个
                                           (l)
             式(19) 中,符号 ·表示向量点乘,r            是一个向量,其
                                                               样本的 36维特征,作为DNN网络的输入特征,特征
             元素为服从伯努利随机分布的随机变量,分别以概
                                                               空间如图3所示。
             率P 和1 − P 取1和0为值,参数P 是每个神经元的
             激活概率,通常 P 取 [0.5,1.0]。使用该向量对上一
             层网络的输出 y      (l)  进行采样,产生一个约减的输出
                                                                                                        2
              (l)
             ˜ y  用于下一次网络的输入。这个操作依次进行,从
             而可以生成一个稀疏的网络结构                [17] 。这种方法简                5                                 0
             单易行、节省运算资源,且不会提升优化过程的复                                 ྲढ़ࣨϙ  0
             杂度。改进后的 DNN 能够从有效的数据维度上学                               -5                             30
                                                                    1000                               -2
             习到相对稀疏的特征,达到自动提取水声信号关键                                                            20
                                                                            500            10 ྲढ़፥஝
             特征的效果。                                                      ᡰሏጊळՂ                         -4
                                                                                     0 0
             2 数值仿真                                                             图 3  特征空间
                                                                             Fig. 3 Feature space
                 通过 KRAKEN 声场计算工具,在声速正梯度
             浅海环境参数下生成仿真数据。图2 描述了本文所                               每个特征之间并不完全独立,有些特征与声源
             使用的环境参数。                                          距离显著相关,这里根据 1.2 节中的 mRMR 算法进
                                                               行特征选择。基于互信息的 mRMR 最高效和常用
                         R=1~10 km
                                                               的 [21] ,在步骤 (4) 中,输出所选特征的互信息熵作
                                           1520.0 m/s
                     z S =3 m                                  为特征重要性的评价指标,对特征空间上所有特征
                                 z R=5 m
                                                               进行重要度排序,结果如图4所示。
                                 z R =35 m
                                                                   图4 中的符号和表 1、表2 中一一对应,例如 DS
                                                               是下降斜率,SV_Mean 是对信号每一帧的谱通量
                   D=150 m
                                z R=145 m                      求的平均值;AC_Std 是对每一帧自相关系数求的
                                              1522.0 m/s
                                                               标准差。由排序结果可见与声源距离相关性最强的
                             ρ=1.899 g/cm 3
                  ӧ௄ᬍቇᫎ                        1679.4 m/s
                             α P=0.4477 dB/λ                   前3项特征是激励时间、下降斜率和谱通量均值,分
                                                               别代表激励阶段的时间长度、衰减阶段能量的平均
                              图 2  环境参数
                                                               时间斜率和频谱包络面积的均值,这些物理量恰是
                      Fig. 2 Enviromental parameters
                                                               反映声能量在传播过程中衰减的基本物理量。通
                 仿真数据包括连续波 (Continuous wave, CW)               常,为了兼顾特征集合的多样性和紧凑性,指标的阈
             在 50 Hz、150 Hz 和 300 Hz 的信号, 线性调频                 值不宜过大或过小,经测试这里取 0.03 时,特征子
             (Linear frequency modulation, LFM) 信号中心频          集的维度为 29,此时模型收敛性较好。最终得到与
             率为 500 Hz、1000 Hz 和 2000 Hz,频带宽度范围                声源距离相关性最高的 10 维时域特征与 19 维频域
             100 ∼ 1000 Hz,信号长度 0.2 ∼ 1.0 s。将模拟接               特征。
   125   126   127   128   129   130   131   132   133   134   135