Page 142 - 《应用声学)》2023年第5期
P. 142
1034 2023 年 9 月
网络 (Deep belief network, DBN) 模型应用于水声
0 引言
信号被动目标识别任务中,在 40 个类别的目标共
水声目标识别技术对维护海洋权益、海洋资源 1000 个测试样本的测试集上取得了 90.23% 的分类
开发具有十分重要的作用,在反潜、鱼雷防御、海底 正确率,结果表明利用深度学习模型进行水下目
地形勘探等领域应用广泛 [1] 。前期研究表明,水声 标识是一种可行的途径。王强等 [7] 从3 类目标的实
信道受海洋环境的影响会产生多径、衰减、畸变等 测水声数据库中提取梅尔倒谱特征及傅里叶变换
复杂变化,多种类别的水声信号耦合在一起,使得舰 特征,比较了 DBN、卷积神经网络 (Convolutional
船信号往往淹没在背景噪声之中。同时,舰船辐射 neural networks, CNN)、SVM的识别率,其中DBN
噪声具有较大的类内差异性和类间相似性,使得同 的识别率最高。Yue等 [8] 使用CNN和DBN对16种
类型目标在不同的航行状态和环境下,具有不同的 不同类型的水声目标进行了分类,在有监督和无监
噪声辐射特性。除此之外,水声目标类别十分广泛, 督的情况下,其准确率分别达到 94.75% 和 96.96%,
如渔船、货轮、军舰等水面目标;潜艇、海洋生物、钻 其结果优于对比实验中 SVM 和 Wndchrm(用于生
井平台等水下目标,这些问题都增加了水声信号的 物图像分析的开源程序) 的识别精度。考虑到水
识别难度。因此,水声信号目标识别一直是国内外 声目标信号的时序性质,也有学者应用时序模型
水声领域公认的难题。 开展智能识别研究。张少康等 [9] 应用长短时记忆
传统的水声信号特征提取方法经过多年的发 (Long short-term memory, LSTM) 网络分别对水
展,已经从简单的时域或频域特征发展到时 -频结 下目标噪声的时域时间序列数据、频谱数据、梅尔
合、人耳听觉感知、高阶统计量等特征分析方法。其 倒谱数据进行深层次特征提取与识别,并使用实
中,时频分析方法提供了时间域与频率域的联合分 际水声目标噪声信号对该方法进行了验证。结果
布信息,可以清楚地描述信号频率随时间变化的关 表明,在上述 3 种输入数据情况下,采用 LSTM 模
系,是目前最为常用的特征提取方法,如短时傅里叶 型均能有效实现水下目标噪声特征提取与智能识
[2]
变换(Short time Fourier transform, STFT) 、梅尔 别。Li 等 [10] 提出了一种基于时延神经网络 (Time
频率倒谱系数(Mel-Frequency cepstral coefficients, delay neural network, TDNN) 的分类器,用滤波器
[3]
MFCC) 、希尔伯特-黄变换(Hilbert-Huang trans- 组 (Filter bank, Fbank) 提取包含频谱信息的特征
form, HHT) 等。分类器设计方面,常用的方法包括 作为网络的输入,实验结果表明,该方法比 SVM 等
隐马尔科夫模型 (Hidden Markov model, HMM)、 传统方法具有更高的分类精度,且在真实环境下的
高斯混合模型 (Gaussian mixed model, GMM)、支 三重分类实验中准确率达到 90% 以上,说明该分类
持向量机 (Support vector machine, SVM) 以及级 器在建模时间序列和表示复杂非线性关系方面具
联分类器等都在水声信号识别中得到了应用。然 有很大的优势。随着注意力机制 (Attention) 在自
而,传统方法的参数有限无法对大规模数据和海 然语言处理领域的成功应用,许多学者将注意力机
洋环境进行建模,系统部署后难以进行数据的迭代 制运用到水下目标识别领域,也取得了不错的识别
更新,这些问题都使得水声信号依然长期依赖人工 效果。Li 等 [11] 提出了一种基于注意机制和迁移学
判读。 习的船舶辐射噪声识别方法,在公共数据集上实现
近年来,深度学习技术的快速发展,以其对非 了 99% 的识别准确率;徐承等 [12] 将多维自注意力
线性系统的良好拟合能力,为水声目标识别领域 机制引入多特征融合水下目标识别框架,分别在特
提供了新思路。基于深度学习的水声目标识别算 征维度和时间维度高效完成深层次目标弱信息特
法可以利用神经网络自动地学习特征并完成分类。 征抽取,显著提升了识别效果。
越来越多的研究人员开始采用深度学习进行声目 经以上研究启发,本文尝试基于注意力机制和
标识别研究,并借助深度神经网络实现特征优化 TDNN 构建深度网络架构,进行有效地舰船辐射噪
和目标识别 [4−5] ,可有效提高自动识别系统的泛化 声数据深层特征挖掘和分类识别。结果表明,本文
能力和环境适应性。Kamal 等 [6] 首先将深度置信 验证的网络架构方法有效。