Page 126 - 《应用声学》2021年第1期

P. 126

122 2021 年 1 月

效性，对比分析了波形参数对测距性能和模型收敛
0 引言
速度的影响。
声源被动测距作为声呐系统的重要功能之一，
一直是水声工作者密切关注的问题 [1] 。由于水声观 1 理论模型
测信号受复杂的时、空、频变及强多途、高噪声和多 1.1 水声信号多域特征提取
普勒效应等因素影响，传统的匹配场处理方法往往
声信号的多域特征可归纳为 6 类：时域波形结
面临计算量大和环境失配等问题。近年来，深度学
构特征、时域包络特征、频域谱特征、基于 STFT 的
习作为基于数据驱动方式的新兴分支，以其强大的
时频联合域特征、基于等效矩形带宽的听觉谱特征
特征提取能力和高效处理复杂、高维、非线性系统
和基于正弦谐波模型的谐波谱特征 [7] 。每一类特征
问题的独特优势 [2] ，为水声被动测距提供了一种新
均包含了对应谱的多种声音特性，这些特征属性无
思路。
法用单一尺度进行描述，只有在多维特征空间下才
深度神经网络通过大量数据样本建立高维参
能表示。 Peeters等 [8] 对这些声学特征进行总结，并
数之间的复杂非线性映射，适用于物理建模困难的
通过多维标度法提取了合适的声学参数，使之与声
问题，引发了水声研究者的关注。Lefort 等 [3] 通过
信号在每个维度上的坐标呈现较大的相关性。
水箱实验研究了机器学习算法在水声目标测距中
这些声学参数是基于不同谱表达计算的，其表
的测距性能。Niu 等 [4] 利用单水听器和残差卷积神
征的物理含义各有不同，而水下声源物理特征和声
经网络对声源进行定位。Wang等 [5] 提出了一种用
场信息主要包含在信号的时域波形、频域能量分布
于水下声源测距的深度迁移学习方法，将从仿真环
中。因此，本文综合了以上更符合水声信号特点的
境获得的预测能力迁移到实验海域。
前 4 类特征，并将所对应的特征归纳为时域特征和
水声接收信号包含声源和声信道的大量信息，
时频联合域特征。
其特征提取和构造是深度学习方法的关键环节。
1.1.1 时域特征
早期特征提取通常利用信号的自相关函数和功率
谱估计，或采用时 -频分析方法来提取一些时频联水声信号时域波形反映了信道对声信号传播
合域特征，如短时傅里叶变换 (Short-time Fourier 的畸变作用，是获取声源总体特征最直接的来源。
transform, STFT)、Wingner-Ville分布等。然而，无为了直接从时域提取特征，自相关系数是一种广泛
论是功率谱分析还是时频分析 [6] ，它们包含大量与使用的分类特征。首先是对原始信号 s(t n ) 求自相
声源位置不相关的信息或冗余信息，在形式上维数关系数，t n 代表信号时刻，保留前 N 维的自相关系
较大，一般无法直接应用于测距任务。而且，单一地数(c ∈ {1, · · · , N})表示为 [9]
采用某类特征通常会丢失掉部分特征，缺乏全面性。 1 L n −c−1
∑
ρ(c) = s(t n )s(t n+c ), (1)
针对以上问题，本文设计了一种基于多域特征 ρ(0)
n=0
提取和深度学习的方法来实现声源被动测距。首
其中，L n 是分帧时的窗长，c 代表时间的滞后量。
先从声信号中提取多域特征，包含时域波形结构特
当声源信号为瞬态声信号时，其随时间变化经历
征、时域包络特征、频域谱特征和基于STFT的时频
ADSR过程，即激励阶段、衰减阶段、稳态持续阶段、
联合域特征。然后基于不同谱表达计算出一组声学
释音残响阶段，如图 1 所示，其中激励阶段到衰减阶
参数构成特征空间，在此基础上采用最大相关 - 最
段以信号振幅峰值处为分界点，后三阶段统称为下
小冗余准则(Maximum relevance and minimum re-
降阶段。
dundancy, mRMR) 选择特征空间中重要度高的关
键特征 (与声源位置相关性大) 作为模型输入，最后 ૝ࣨ
通过一种改进的深度神经网络实现声源距离的估
计。神经网络训练时采用自适应矩估计 (Adaptive ᧖ᮃ
൵־
moment estimation, Adam) 优化算法和均方误差 ༏ҵ ᛰѓ ሷগે፞
(Mean squared error, MSE) 代价函数进行更新模 t st t Aend ௑ᫎ t Dend
型参数，用L2和Dropout 正则化策略实现网络参数图 1 声信号 ADSR 过程
正则化。通过浅海环境仿真实例验证了该方法的有 Fig. 1 ASDR process of sound signals

121 122 123 124 125 126 127 128 129 130 131