Page 107 - 《应用声学》2021年第5期
P. 107
第 40 卷 第 5 期 卢佳敏等: 基于 DEMON 谱和 LSTM 网络的水下运动目标噪声基频检测 751
表 1 本文方法与传统方法的对比结果
Table 1 Comparison between classic methods and the proposed method
P/% 平均误差/Hz
SNR = 3 dB SNR = −2 dB SNR = 3 dB SNR = −2 dB
CNN+LSTM 84.4 73.9 0.23 0.41
改进的最大公约数 [12] 74.3 62.6 0.62 1.04
序列匹配法 [13] 76.7 64.5 0.58 0.65
表 2 与文献 [26] 进行对比 时,前者的 P 值上升至 75% 左右,而后者提高至
Table 2 Comparison with the method in 84% 左右。由实验结果能够看出,随着帧长的增加,
Ref. [26] 输入网络的特征信息将增多,基频的检测精度上升;
而在相同的帧长情况下,添加 LSTM 层后精度有较
每个输出对应的输入
P/% (SNR = 3 dB) 大的提升,表明 LSTM 网络能够较大幅度提升基频
信号时长/s
检测的准确率。
20 85.4
文献 [26]
10 77.4 表 3 CNN 与 CNN+LSTM 的实验结果对比
3 73.8 Table 3 Comparison between CNN and
CNN+LSTM 6 84.4 CNN + LSTM
10 86.5
每帧信号时长/s P/% (SNR = 3 dB)
从表 2 可以看出,当信号输入时长上由 20 s 下 1 52.7
CNN
降至 6 s 时,本文的检测算法几乎达到同样的准确 2 74.9
率;而输入时长增加至10 s时,误差小于0.1 Hz的预
1 73.8
测值比例P 会略高于CNN网络。因此,尽管简化了 CNN+LSTM
2 84.4
预处理程序,但是 LSTM 网络却能够以较短的信号
输入时长获得大致相同的 P 值;从不同时长的检测 3.4 外场实验数据分析
结果能够看出,本文的方法在时效性上有了较大的
分别利用湖试数据和海试数据对所提算法进
提升。对于本文提出的算法,对比时长为 3 s 和 6 s
行测试。其中,湖试数据于千岛湖外场实验中获得,
的实验结果,可以发现时长较长的信号能够提供更
目标船只吨位为几十吨级,接收距离约 1 km,共
多稳定的检测结果。由于计算代价和信号长度成正
采集 216 段数据;海试数据于三亚外场实验中获得,
比,这也提示我们可以通过调整输入信号的时长来
为百吨级渔船噪声,接收距离约 2 km,共采集 162
满足不同任务对准确率和实时性的不同需求。
段数据。两次实验的接收阵均为 24 阵元的水平线
3.3 CNN 和CNN+LSTM的检测结果对比 阵,阵元距离 1.875 m,位于水下 15 m,采样频率
为了验证 LSTM 网络从时序 DEMON 谱中提 为 20 kHz。数据共包含 5 种不同转速,基频范围为
取统计特征的能力,分别采用CNN和CNN+LSTM 5 ∼ 10 Hz。对使用湖试数据进行基频估计前,先利
网络进行基频检测。表 3 列出了两种网络结构在不 用实测噪声数据对神经网络的权值进行微调学习。
同的输入信号长度上的实验结果。CNN 的输入为 为了扩充数据集,本文采用加噪、平移、缩放等方式
一帧语音信号计算的 DEMON谱,添加 LSTM层的 对实测数据进行数据集扩充。使用20%的数据作为
网络每输入 5 个时间帧输出一个检测结果,其中帧 训练集,其余80%数据作为测试集。
间重叠为50%。 将无目标情况下采集到的背景噪声放大后叠
当帧长为1 s时,CNN网络的P 值在53%左右, 加到原始信号上,叠加后信号的信噪比大约为0 dB,
添加 LSTM 结构后增加至 74%;当帧长增加至 2 s 用于验证加噪情况下算法的性能。