Page 136 - 《应用声学》2021年第1期
P. 136

132                                                                                  2021 年 1 月


                                                               normalization, BN)提升模型性能。经研究,深度神
             0 引言
                                                               经网络模型相较于恒等映射更易于学习残差映射,
                 近年来,为顺应现代海战的演进趋势,水下对                          因此本文借鉴 DnCNN,利用残差学习的思想,学习
             抗正朝着体系化、无人化、智能化方向发展。在有关                           带噪信号 STFT 特征和带噪信号与纯净信号STFT
             海区及时侦测未知声呐发射的脉冲信号,并分析其                            特征值残差之间的映射关系,与之前提到的 CNN
             性能是水声对抗的重要任务之一。由于声源位置的                            语音增强网络不同的是,本文脉冲信号去噪网络的
             远近未知,加上海洋环境变化多端,致使接收信噪比                           输入包含 STFT 特征的实部和虚部两个通道,并不
             较低,因此需要利用适当的去噪方法对脉冲信号进                            仅是幅值特征,学习的目标是残差的实虚部两通道
             行增强,以便进行后续的信号处理与分析。                               分量。文献 [7] 指出批标准化仅在高斯分布噪声条
                 脉冲信号持续时间较短,传统的自适应滤波去                          件下具备良好的性能,本文训练集噪声包括高斯及
             噪方法难以在脉冲持续时间内有效收敛,并且传统                            另外两种非高斯噪声,为提升模型在复杂噪声场景
             方法中大多基于环境噪声为高斯分布的假设,经过                            中的泛化性,模型去掉批标准化层。本文模型相较
             研究,实际应用中的海洋环境噪声还常常表现为非                            于传统去噪方法主要有以下优点:首先,深度学习可
             高斯分布。α 稳定分布的脉冲噪声以及非平稳的行                           以通过训练使模型适用于多种类型脉冲信号及环
             船噪声是海洋环境中两种常见的非高斯噪声。当假                            境噪声,再者,传统方法如自适应滤波方法对参数设
             设背景噪声为高斯噪声时,可利用水声信号的二阶                            置如权值初值、更新步长等较为敏感,而训练完毕
             或高阶统计量进行信号处理,由于分数低阶的 α 稳                          的神经网络仅根据输入带噪数据进行计算,无需人
             定分布不存在有限的二阶及以上各阶统计量                     [1] ,此    为设定参数。
             类算法在这种情况下会发生性能下降,另外非平稳
                                                                   本文针对两种常见的非高斯环境中脉冲信号
             行船噪声也会为传统的基于自适应滤波的去噪方
                                                               的去噪问题,提出一种基于深度学习的处理手段。首
             法收敛带来困难。
                                                               先对接收带噪信号进行 STFT,提取其实部与虚部
                 短时傅里叶变换 (Short time Fourier transfor-
                                                               分量,之后建立全卷积的水声脉冲信号去噪网络,实
             mation, STFT) 是一种线性时频分析方法,其算法
                                                               现多种环境噪声中的多种脉冲信号的增强,最后通
             实现简单高效,并且不会产生交叉项,在工程实践
                                                               过逆变换重构脉冲信号的时域序列。本文仿真 3 种
             中得到了广泛的应用。随着深度学习领域的蓬勃发
                                                               常见脉冲信号:连续波 (Continuous wave, CW) 信
             展,近年来出现了大量利用深度学习方法进行语音
                                                               号、线性调频 (Linear frequency modulation, LFM)
             增强的研究,这些研究利用语音信号 STFT 幅值特
                                                               信号、双曲调频(Hyperbolic frequency modulation,
             征进行语音信号去噪与重构。文献 [2–3] 利用卷积
                                                               HFM) 信号,添加高斯噪声、α 稳定分布噪声以及非
             神经网络 (Convolutional neural network, CNN) 学
                                                               平稳行船噪声,生成不同信噪比或广义信噪比下的
             习带噪信号STFT幅值与纯净信号STFT幅值之间
                                                               样本,用以训练模型。通过在仿真测试集以及实测
             的映射关系实现去噪,文献 [4–5]利用循环神经网络
                                                               样本上的测试,并对比传统去噪方法,验证本文方法
             (Recurrent neural network, RNN)建立各帧数据上
                                                               在脉冲信号去噪与重构任务中的有效性。
             下文之间的关系,利用前后序列的相关性进行去
             噪,也取得了较好的结果。相较于 RNN,CNN 网
             络参数更少,并且不存在 RNN 网络的长期依赖问                          1 非高斯噪声
             题,更易于训练。CNN 语音增强模型利用增强语
             音幅值特征与原带噪语音谱的相位分量来重构信                                 常见的声呐发射脉冲信号有CW信号、LFM信
             号。语音信号的去噪仅对幅值谱进行处理,是因为                            号、HFM信号等。实际水声环境中的噪声常呈现非
             相位对于语音信号的可懂度影响不大                   [2] ,然而对       高斯分布。由于工业活动、地震风暴及海洋生物等
             于水声脉冲信号其相位与幅值特征均是重要的信                             因素的影响,会存在大量的脉冲干扰,这种噪声可用
             息。文献 [6] 提出一种 DnCNN 的图像去噪网络,可                     α 稳定分布来描述        [8] 。另外行驶船舶也会产生一种
             在未知背景噪声级的情况下实现盲去噪,利用残                             非平稳噪声,本文主要研究高斯噪声和这两种非高
             差学习 (Residual learning, RL) 和批标准化 (Batch          斯环境噪声中的脉冲信号增强。
   131   132   133   134   135   136   137   138   139   140   141