Page 133 - 《应用声学》2021年第1期
P. 133
第 40 卷 第 1 期 肖旭等: 基于多域特征提取和深度学习的声源被动测距 129
目前已有相关研究 [5] 通过在真实海洋测试数据的 of scaling source range using matched field processor side-
基础上扩充仿真数据,以及采用迁移学习方法来减 lobes in uncertain ocean environment[J]. Communication
Electroacoustics, 2009, 33(7): 76–80.
小深度学习方法对先验知识的依赖性。本文下一步
[2] 胡志新. 基于深度学习的化工故障诊断方法研究 [D]. 杭州:
工作将针对海洋测试中远距离测距的实际应用场 杭州电子科技大学, 2018.
景,通过建立数据库、优化神经网络结构、提高网络 [3] Lefort R, Real G, Drémeau A. Direct regressions for
复杂度、增加输出节点数或改进输出层标签形式、 underwater acoustic source localization in fluctuating
oceans[J]. Applied Acoustics, 2017, 116: 303–310.
增强自学习能力,以提升测距范围和测距分辨率。
[4] Niu H, Gong Z, Ozanich E, et al. Deep-learning source lo-
此外,可通过对数据库进一步扩充与声源目标识别 calization using multi-frequency magnitude-only data[J].
相关的特征和标签,从而在声源被动测距的基础上 The Journal of the Acoustical Society of America, 2019,
同时执行目标识别相关的任务,如估计目标材料、形 146(1): 211.
[5] Wang W, Ni H, Su L, et al. Deep transfer learning for
状、运动姿态等,以上需在后续工作中进一步探究。
source ranging: deep-sea experiment results[J]. The Jour-
nal of the Acoustical Society of America, 2019, 146(4):
4 结论 EL317–EL322.
[6] 李思纯. 基于矢量水听器的目标特征提取与识别技术研
采用一种基于多域特征提取的深度学习方法 究 [D]. 哈尔滨: 哈尔滨工程大学, 2008.
来实现声源测距,通过浅海环境仿真实例验证了 [7] 李晗, 陈克安, 田旭华. 基于平板冲击声的声源特性表征及自
动识别 [J]. 应用声学, 2016, 35(4): 294–301.
该方法的有效性,并分析了波形参数对测距性能和
Li Han, Chen Ke’an, Tian Xuhua. Characteriza-
模型收敛速度的影响。本方法构建了声信号在时、 tion of sound source physical properties and automatic
频域的多维感知特征量,采用最大相关 -最小冗余 identi?cation based on impact sounds of plates[J]. Jour-
准则 (mRMR) 提取了声源和水下声场的关键信息, nal of Applied Acoustics, 2016, 35(4): 294–301.
[8] Peeters G, Giordano B L, Susini P, et al. The Timbre
在传统深度神经网络的基础上引入自适应矩估计
Toolbox: extracting audio descriptors from musical sig-
(Adam)优化、L2 正则化和 Dropout 正则化处理,提 nals[J]. The Journal of the Acoustical Society of America,
升模型的收敛速度和泛用性。结果表明:此方法在 2011, 130(5): 2902–2916.
模型训练过程中收敛速度较快,预测性能较稳定,在 [9] Brown J C, Houix O, Mcadams S. Feature dependence in
the automatic identification of musical woodwind instru-
所定条件下测试集上声源的综合测距精确率可达
ments[J]. The Journal of the Acoustical Society of Amer-
到 95% 以上,能够实现对声源距离的有效估计。此 ica, 2001, 109(3): 1064–1072.
外,对不同发射信号训练效率的对比表明,算法性能 [10] Krimphoff J, McAdams S, Winsberg S. Characterization
对波形参数和声源深度具有良好的鲁棒性,模型收 of the timbre of complex sounds. 2. Acoustic analysis and
psychophysical quantification[J]. Journal de Physique,
敛速度和测距精度对于带宽较小、持续时间长的瞬 1994, 4(5): 625–628.
态发射信号较高。训练后的模型在单次测距任务中 [11] Peeters G, Mcadams S, Herrera P. Instrument descrip-
仅需执行毫秒级运算,可实现数据的实时处理。 tion in the context of MPEG-7[C]. Proc Icmc, 2000, 1(3):
S125.
本文提出采用的声源测距的深度学习方法,紧
[12] 杨立学, 陈克安, 李双, 等. 飞机舱内声品质的音色参数表
密结合了和海洋环境、传输距离相关的声源信号时
达 [J]. 西北工业大学学报, 2015, 33(3): 444–450.
频域多维感知特征,测试集上声源测距精度优良、可 Yang Lixue, Chen Ke’an, Li Shuang, et al. Timbre pa-
信。未来,建立并不断更新充实功能齐全、信息丰富 rameter representations of aircraft cabin sound quality[J].
Journal of Northwestern Polytechnical University, 2015,
的各种典型海洋环境参数、传输距离及声源信号多
33(3): 444–450.
域特征大数据库,进一步优化算法和自学习能力后, [13] Scheirer E, Slaney M. Construction and evaluation of a
本方法可望实现实时准确的水下目标被动定位、跟 robust multifeature speech/music discriminator[C]. Proc
踪和分类识别,是今后深入研究的目标和方向。 Icassp, 1997, 2.
[14] 朱知萌. 水下蛙人呼吸声信号特征提取研究 [D]. 哈尔滨: 哈
尔滨工程大学, 2016.
参 考 文 献 [15] 旷玮, 姬培锋, 杨军. 笙的簧片物理参数与音色相关性的初步
研究 [J]. 应用声学, 2016, 35(6): 494–504.
[1] 张宗航, 孙超, 郭国强. 不确实海洋环境中的旁瓣结构声源测 Kuang Wei, Ji Peifeng, Yang Jun. A study of the relation-
距方法 [J]. 电声技术, 2009, 33(7): 76–80. ship between the physical parameters of Sheng reed and
Zhang Zonghang, Sun Chao, Guo Guoqiang. A method the timbre[J]. Journal of Applied Acoustics, 2016, 35(6):