Page 130 - 《应用声学》2021年第1期
P. 130
126 2021 年 1 月
一层,随机将部分节点对应的权重值置零,使得线性 收信号拷贝 100 份并分成 10组,每一组模拟接收信
系数矩阵和偏置向量达到稀疏化的效果,在一定程 号分别添加信噪比 (Signal-to-noise ratio, SNR) 为
度上避免过拟合的问题。引入 Dropout 的神经网络 1 dB、2 dB、3 dB、· · · 、10 dB的高斯噪声。接收点距
描述由式(12)变为 [17] : 离分布在 1 ∼ 10 km,深度是分布在 5 ∼ 145 m,网
络输入训练集占总样本集 80%,由 16080 个样本组
(l)
r ∼ Bernoulli(p),
j
成,剩余 20% 的数据作为测试集,由 4020 个样本组
(l) (l) l
˜ x = r · y ,
(19) 成。对生成样本进行多域特征提取,对每一帧得到
(l+1) = w (l+1) l (l+1) ,
y + b
x
i i i 的特征序列求统计特征,得到均值和方差,对所有帧
(l+1) (l+1)
y = f(x ), 的自相关系数和频域特征序列求统计特征,得到所
i i
有帧的时间均值和时间方差。最终提取到 20100 个
(l)
式(19) 中,符号 ·表示向量点乘,r 是一个向量,其
样本的 36维特征,作为DNN网络的输入特征,特征
元素为服从伯努利随机分布的随机变量,分别以概
空间如图3所示。
率P 和1 − P 取1和0为值,参数P 是每个神经元的
激活概率,通常 P 取 [0.5,1.0]。使用该向量对上一
层网络的输出 y (l) 进行采样,产生一个约减的输出
2
(l)
˜ y 用于下一次网络的输入。这个操作依次进行,从
而可以生成一个稀疏的网络结构 [17] 。这种方法简 5 0
单易行、节省运算资源,且不会提升优化过程的复 ྲढ़ࣨϙ 0
杂度。改进后的 DNN 能够从有效的数据维度上学 -5 30
1000 -2
习到相对稀疏的特征,达到自动提取水声信号关键 20
500 10 ྲढ़፥
特征的效果。 ᡰሏጊळՂ -4
0 0
2 数值仿真 图 3 特征空间
Fig. 3 Feature space
通过 KRAKEN 声场计算工具,在声速正梯度
浅海环境参数下生成仿真数据。图2 描述了本文所 每个特征之间并不完全独立,有些特征与声源
使用的环境参数。 距离显著相关,这里根据 1.2 节中的 mRMR 算法进
行特征选择。基于互信息的 mRMR 最高效和常用
R=1~10 km
的 [21] ,在步骤 (4) 中,输出所选特征的互信息熵作
1520.0 m/s
z S =3 m 为特征重要性的评价指标,对特征空间上所有特征
z R=5 m
进行重要度排序,结果如图4所示。
z R =35 m
图4 中的符号和表 1、表2 中一一对应,例如 DS
是下降斜率,SV_Mean 是对信号每一帧的谱通量
D=150 m
z R=145 m 求的平均值;AC_Std 是对每一帧自相关系数求的
1522.0 m/s
标准差。由排序结果可见与声源距离相关性最强的
ρ=1.899 g/cm 3
ӧᬍቇᫎ 1679.4 m/s
α P=0.4477 dB/λ 前3项特征是激励时间、下降斜率和谱通量均值,分
别代表激励阶段的时间长度、衰减阶段能量的平均
图 2 环境参数
时间斜率和频谱包络面积的均值,这些物理量恰是
Fig. 2 Enviromental parameters
反映声能量在传播过程中衰减的基本物理量。通
仿真数据包括连续波 (Continuous wave, CW) 常,为了兼顾特征集合的多样性和紧凑性,指标的阈
在 50 Hz、150 Hz 和 300 Hz 的信号, 线性调频 值不宜过大或过小,经测试这里取 0.03 时,特征子
(Linear frequency modulation, LFM) 信号中心频 集的维度为 29,此时模型收敛性较好。最终得到与
率为 500 Hz、1000 Hz 和 2000 Hz,频带宽度范围 声源距离相关性最高的 10 维时域特征与 19 维频域
100 ∼ 1000 Hz,信号长度 0.2 ∼ 1.0 s。将模拟接 特征。