Page 135 - 应用声学2019年第4期
P. 135
第 38 卷 第 4 期 曾赛等: 水下目标多模态深度学习分类识别研究 595
大达 13.9%,单一深度学习模型识别率下降最大可 [5] Arel I, Rose D C, Karnowski T P. Deep machine learning-
达9.3%,多模态深度学习模型识别率最大下降小于 a new frontier in artificial intelligence research[J]. IEEE
Computational Intelligence Magazine, 2010, 5(4): 13–18.
8%。在测试集为 −12 dB 时,多模态深度学习模型
[6] 刘建伟, 刘媛, 罗雄麟. 深度学习研究进展 [J]. 计算机应用研
识别率达到 88% 以上,依然具有较好的分类识别效 究, 2014, 31(7): 1921–1930, 1942.
果,说明多模态深度学习模型的鲁棒性优于 SVM Liu Jianwei, Liu Yuan, Luo Xionglin. The research and
progress of deep learning[J]. Application Research of Com-
模型和单一模态深度学习模型。
puters, 2014, 31(7): 1921–1930, 1942.
通过实验一和实验二可以看出,在不同测试比 [7] Goodfellow I, Bengio Y. 深度学习 [M]. 北京: 人民邮电出版
和信噪比条件下,多模态深度学习模型识别率均优 社, 2017.
于传统机器学习模型和单一模态深度学习模型。 [8] Hinton G E, Salakhutdinov R R. Reducing the dimen-
sionality of data with neural networks[J]. Science, 2006,
313(5786): 504–507.
5 结论 [9] Hinton G, Deng L, Yu D, et al. Deep neural networks
for acoustic modeling in speech recognition: the shared
随着水声科学数据量的积累,迫切需要借鉴机 views of four research groups[J]. IEEE Signal Processing
Magazine, 2012, 29(6): 82–97.
器学习方法对数据处理,如进行水下目标分类识别。
[10] Chen J L, Summers J E. Deep neural networks for learn-
本文利用统计机器学习思想,对 CNN 和 LSTM 网 ing classification features and generative models from syn-
络深度学习方法进行分析,从数据空间关联和特征 thetic aperture sonar big data[C]//172nd Meeting of the
Acoustical Society of America. Honolulu, Hawaii, 28
融合的角度考虑,建立了水下目标多模态深度学习
November-02 December, 2016: 1–13.
分类识别方法,充分利用了水声信号不同模态之间 [11] Niu H, Reeves E, Gerstoft P. Source localization in an
的特征,对融合特征进行共享关联表示,并基于信号 ocean waveguide using supervised machine learning[J].
的时间相关性优化了训练模型。利用实际的水声目 Journal of the Acoustical Society of America, 2017, 142(3):
1176–1180.
标辐射噪声数据对算法进行了验证,将其分类识别 [12] Huang Z, Xu J, Gong Z, et al. Source localization using
性能与传统机器学习方法和单一模态深度学习方 deep neural networks in a shallow water environment[J].
法进行了比较,结果表明本文提出的多模态深度学 Journal of the Acoustical Society of America, 2018, 143(5):
2922–2932.
习方法的有效性和优越性,该方法为水下目标分类 [13] 杨宏晖, 申昇, 姚晓辉, 等. 用于水声目标特征学习与识别的混
识别提供了新思路。 合正则化深度置信网络 [J]. 西北工业大学学报, 2017, 35(2):
220–225.
Yang Honghui, Shen Sheng, Yao Xiaohui, et al. Un-
参 考 文 献 derwater acoustic target feature learning and recognition
using hybrid regularization deep belief network[J]. Jour-
nal of Northwestern Polytechnical University, 2017, 35(2):
[1] Deng L, Yu D. Deep learning: methods and applica- 220–225.
tions[J]. Foundations and Trends in Signal Processing, [14] 王强, 曾向阳. 深度学习方法及其在水下目标识别中的应
2014, 7(3/4): 197–387. 用 [C]. 中国声学学会水声学分会 2015 年学术会议论文集,
[2] Suykens J A K, Vandewalle J. Least squares support vec- 2015.
tor machine classifiers[J]. Neural Processing Letters, 1999, [15] Mobahi H, Collobert R, Weston J. Deep learning from
9(3): 293–300. temporal coherence in video[C]// Proceedings of the 26th
[3] Zivkovic Z. Improved adaptive Gaussian mixture model Annual International Conference on Machine Learning.
for background subtraction[C]//Proc of the 17th Int Conf Montreal, Quebec, Canada: ACM, 2009: 737–744.
on Pattern Recognition. Piscataway, NJ: IEEE, 2004: [16] 程东阳. 基于无监督特征学习的多媒体内容理解算法研
28–31. 究 [D]. 上海: 上海交通大学, 2014.
[4] Quattoni A, CollinsM, Darrell T. Conditional random [17] 由清圳. 基于深度学习的视频人脸识别方法 [D]. 哈尔滨: 哈
fields for object recognition[C]//Proc of the Advances in 尔滨工业大学, 2012.
Neural Information Processing Systems. Cambridge, MA: [18] 蒋子阳. TensorFlow 深度学习算法原理与编程实战 [M]. 北
MIT Press, 2004: 1097–1104. 京: 中国水利水电出版社, 2018.