Page 107 - 《应用声学》2021年第5期
P. 107

第 40 卷 第 5 期      卢佳敏等: 基于 DEMON 谱和 LSTM 网络的水下运动目标噪声基频检测                                    751


                                             表 1  本文方法与传统方法的对比结果
                          Table 1 Comparison between classic methods and the proposed method

                                                      P/%                       平均误差/Hz

                                            SNR = 3 dB  SNR = −2 dB      SNR = 3 dB   SNR = −2 dB
                            CNN+LSTM           84.4         73.9            0.23          0.41
                         改进的最大公约数     [12]     74.3         62.6            0.62          1.04
                            序列匹配法   [13]       76.7         64.5            0.58          0.65



                        表 2   与文献 [26] 进行对比                    时,前者的 P 值上升至 75% 左右,而后者提高至
                Table 2 Comparison with the method in          84% 左右。由实验结果能够看出,随着帧长的增加,
                Ref. [26]                                      输入网络的特征信息将增多,基频的检测精度上升;
                                                               而在相同的帧长情况下,添加 LSTM 层后精度有较
                          每个输出对应的输入
                                         P/% (SNR = 3 dB)      大的提升,表明 LSTM 网络能够较大幅度提升基频
                             信号时长/s
                                                               检测的准确率。
                                20             85.4
                 文献 [26]
                                10             77.4               表 3   CNN 与 CNN+LSTM 的实验结果对比
                                 3             73.8               Table 3  Comparison between CNN and
               CNN+LSTM          6             84.4               CNN + LSTM

                                10             86.5
                                                                              每帧信号时长/s P/% (SNR = 3 dB)
                 从表 2 可以看出,当信号输入时长上由 20 s 下                                        1             52.7
                                                                      CNN
             降至 6 s 时,本文的检测算法几乎达到同样的准确                                             2             74.9
             率;而输入时长增加至10 s时,误差小于0.1 Hz的预
                                                                                   1             73.8
             测值比例P 会略高于CNN网络。因此,尽管简化了                              CNN+LSTM
                                                                                   2             84.4
             预处理程序,但是 LSTM 网络却能够以较短的信号
             输入时长获得大致相同的 P 值;从不同时长的检测                          3.4  外场实验数据分析
             结果能够看出,本文的方法在时效性上有了较大的
                                                                   分别利用湖试数据和海试数据对所提算法进
             提升。对于本文提出的算法,对比时长为 3 s 和 6 s
                                                               行测试。其中,湖试数据于千岛湖外场实验中获得,
             的实验结果,可以发现时长较长的信号能够提供更
                                                               目标船只吨位为几十吨级,接收距离约 1 km,共
             多稳定的检测结果。由于计算代价和信号长度成正
                                                               采集 216 段数据;海试数据于三亚外场实验中获得,
             比,这也提示我们可以通过调整输入信号的时长来
                                                               为百吨级渔船噪声,接收距离约 2 km,共采集 162
             满足不同任务对准确率和实时性的不同需求。
                                                               段数据。两次实验的接收阵均为 24 阵元的水平线
             3.3 CNN 和CNN+LSTM的检测结果对比                          阵,阵元距离 1.875 m,位于水下 15 m,采样频率
                 为了验证 LSTM 网络从时序 DEMON 谱中提                     为 20 kHz。数据共包含 5 种不同转速,基频范围为
             取统计特征的能力,分别采用CNN和CNN+LSTM                         5 ∼ 10 Hz。对使用湖试数据进行基频估计前,先利
             网络进行基频检测。表 3 列出了两种网络结构在不                          用实测噪声数据对神经网络的权值进行微调学习。
             同的输入信号长度上的实验结果。CNN 的输入为                           为了扩充数据集,本文采用加噪、平移、缩放等方式
             一帧语音信号计算的 DEMON谱,添加 LSTM层的                        对实测数据进行数据集扩充。使用20%的数据作为
             网络每输入 5 个时间帧输出一个检测结果,其中帧                          训练集,其余80%数据作为测试集。
             间重叠为50%。                                              将无目标情况下采集到的背景噪声放大后叠
                 当帧长为1 s时,CNN网络的P 值在53%左右,                     加到原始信号上,叠加后信号的信噪比大约为0 dB,
             添加 LSTM 结构后增加至 74%;当帧长增加至 2 s                     用于验证加噪情况下算法的性能。
   102   103   104   105   106   107   108   109   110   111   112