Page 125 - 《应用声学》2021年第1期
P. 125

第 40 卷 第 1 期                                                                       Vol. 40, No. 1
             2021 年 1 月                          Journal of Applied Acoustics                   January, 2021

             ⋄ 研究报告 ⋄



                基于多域特征提取和深度学习的声源被动测距                                                                    ∗



                   肖 旭    1,2,3  王 同    1,2,3  王文博      1,2,3  苏 林    1,2   马 力    1,2,3  任群言      1,2,3†


                                         (1 中国科学院水声环境特性重点实验室           北京   100190)
                                              (2 中国科学院声学研究所       北京   100190)

                                                (3 中国科学院大学      北京  100049)
                摘要:采用一种基于多域特征提取的深度学习方法来实现声源被动测距。首先从声信号中提取多域特征,包
                含时域波形结构特征、时域包络特征、频域谱特征和基于短时傅里叶变换的时频联合域特征;然后基于不同谱
                表达计算出一组声学参数构成特征空间,在此基础上采用最大相关 -最小冗余准则选出特征空间中与声源位
                置相关性高的关键特征作为模型输入;最后通过一种改进的深度神经网络实现声源距离的估计,引入自适应
                矩估计优化算法进行模型训练,利用 L2 和 Dropout 正则化策略实现网络参数稀疏化。通过声速正梯度浅海环
                境仿真实例对方法进行验证,对比分析了波形参数对测距性能和模型收敛速度的影响。结果表明,此方法在模
                型训练过程中收敛速度较快,预测性能较稳定,在所定条件下测试集上声源信号的综合测距精确率达到 95%
                以上。
                关键词:多域特征提取;深度学习;声源被动测距
                中图法分类号: TB566           文献标识码: A          文章编号: 1000-310X(2021)01-0121-10
                DOI: 10.11684/j.issn.1000-310X.2021.01.015

                Source ranging based on deep learning and multi-domain feature extraction:

                                                   synthetic results


                XIAO Xu  1,2,3  WANG Tong 1,2,3  WANG Wenbo   1,2,3  SU Lin 1,2  MA Li 1,2,3  REN Qunyan 1,2,3

                   (1 Key Laboratory of Underwater Acoustics Environment, Chinese Academy of Sciences, Beijing 100190, China)
                               (2 Institute of Acoustics, Chinese Academy of Sciences, Beijing 100190, China)
                                   (3 University of Chinese Academy of Sciences, Beijing 100049, China)

                 Abstract: Ranging of underwater acoustic sources is an important task in many practical applications. Deep
                 neural networks (DNNs) have shown outstanding performance on illustrating complex nonlinear relationships.
                 In terms of localization, DNNs were demonstrated to have low range estimation error under low SNR conditions.
                 In this study, source localization is achieved by a deep learning method based on a set of multi-domain features
                 extracted from sound signals. In this study, a comprehensive set of acoustic parameters are extracted from
                 sound signals. The waveform, energy envelope, short-term Fourier transform are first estimated from the
                 sound signals, based on which, the acoustic parameters are computed and used as the training data set for the
                 estimation of source in a DNN. Training the deep architecture is achieved by Adam optimizer and dropout for
                 parameter regularization with mean squared error (MSE) loss functions.
                 Keywords: Multi-domain extraction; Deep learning; Source ranging


             2020-04-21 收稿; 2020-07-15 定稿
             国家自然科学基金项目 (11704396)
             ∗
             作者简介: 肖旭 (1996– ), 男, 湖南长沙人, 博士研究生, 研究方向: 水声物理。
             † 通信作者 E-mail: renqunyan@mail.ioa.ac.cn
   120   121   122   123   124   125   126   127   128   129   130