Page 140 - 《应用声学》2021年第3期
P. 140

458                                                                                  2021 年 5 月


                                                               件信号差异性表征的困难,直接利用现有数据进行
             0 引言
                                                               分类识别,会出现次声信号特征聚集性不强、识别
                                                               率不够高的结果。为提高识别率,传统分类方法需
                 作为国际监测系统 (International Monitoring
                                                               要进行多步数据预处理工作提取出较优的特征组
             System, IMS) 四种技术中的一种,次声波为有效监
                                                               合,并选择合适的分类方法实现次声事件的分类识
             测大气层核试验以及地面或水面核爆炸提供了重
                                                               别,这样的信号处理过程相对复杂,这对次声事件的
             要帮助   [1−2] 。次声监测技术同样可以作为火山喷
                                                               分类工作提出了挑战。针对这一问题,本文考虑引
             发、海啸、天然地震等地质灾害的重要监测手段                     [3] 。
                                                               用深度学习 (Deep learning) 技术来解决。近年来,
                 次声事件的监测与识别研究应用广泛,是核爆
                                                               深度学习在人工智能计算上成效突出。作为深度
             探测、自然灾害预测、大气环境研究、生物效应等方
                                                               学习的一种,卷积神经网络 (Convolutional neural
             面研究的重要组成部分           [4−6] 。次声事件的监测和分
                                                               networks, CNN) 具备强大的特征提取和学习的能
             类识别工作往往是一起的,为提升核爆和地质灾害
                                                               力,能够提取到人工无法描述的特征,并完成分类识
             的监测能力,采取相应措施从而正确识别次声事件,
                                                               别,在数字识别、图像分类与识别、噪声去除等领域
             是有效的途径之一         [7] 。因此,开展次声事件的分类
                                                               上都得到了很好的应用            [16−18] 。基于 CNN 强大的
             研究,对于国家安全和地球物理研究具有重要意义。
                                                               特征提取功能,本文将数据预处理过程简化,提取简
                 20 世纪 50 年代以来,关于次声事件的分类任
                                                               单的特征作为 CNN 的输入,利用 CNN 完成特征提
             务,国内外学者对此进行了深入的探索,主要利用
                                                               取、模型训练和分类识别的工作。
             声学信号处理理论,分别在时域频域提取特征,进
                                                                   本文利用 Welch 功率谱变换进行简单的特征
             而用于分类识别。然而,由于次声的多径效应,导
                                                               提取,采用改进 CNN 完成分类工作,并基于收集
             致原来的信号失真,或者产生错误,分类识别率
                                                               整理的包含815个化学爆炸(简称化爆)和天然地震
             不高。为提高识别率,需要多特征、复杂特征进行
                                                               (简称地震) 次声信号数据集,使用 BP 网络和一维
             综合识别。在国际上,Chilo 等           [8]  等指出小波变换
                                                               LeNet-5网络进行分类对比分析。
             是获取次声事件“指纹”的方式之一。Cannata等                   [9]
             成功运用聚类、分类算法结合特征提取技术实现
                                                               1 数据集及预处理
             对意大利埃特纳火山口的定位。Thomas 等                  [10]  将
             分类算法和次声阵列检测法结合起来,对雪崩灾                             1.1  建立数据集
             害实现预警,其预警错误率可降至 0.1。在国内,姜                             由于条约组织有较多的次声台站用于获取次
             楠等  [11]  提出将次声信号的固有模态函数 (Intrinsic               声信号,因此,本文统一使用从CTBTO官网上收集
             mode function, IMF)的分量比作为特征,再采用支                  到的次声信号数据进行分析,选用信道为BDF格式
             持向量机 (Support veotor maohine, SVM) 完成分            的数据。其主要原因是基于其他信道格式(BD、SD)
             类,可对天然地震、火箭发射、管道爆破进行有效                            的数据量较少,提取到的特征参数不能够充分表征
             分类识别。杨婷婷等         [12]  将次声信号模态分解(Em-             次声事件,也不利于分类判别时训练及测试样本的
             pirical mode decomposition, EMD) 后的奇异谱熵           构造。针对BDF格式的数据具体操作如下:
             作为特征,采用最小二乘支持向量机(Least squares                        步骤 1 读取从 CTBTO 官网上下载的原始数
             support vector machine, LSSVM) 作为分类器,能            据(.w文件),寻找信道为BDF格式的数据;
             够对化学爆炸和矿道爆炸完成较好分类识别。明舒                                步骤 2 统一采样频率,将采样频率高于 20 Hz
             晴  [13]  提出 IMF 显著频率特征提取方法,采用聚类                   的数据进行重新采样;
             算法,实现对火山喷发、地震等3 类地灾次声事件的                              步骤 3 将采样点数不够的数据进行人为的补
             有效分类。随着人工神经网络的兴起,复杂特征与                            齐或去除;
             人工神经网络相结合的方法逐渐应用到了次声事                                 步骤 4 判断提取到的台站数据信息中有无重
             件的分类识别中,对于次声事件识别效果的有效提                            复成分,重复予以去除,不重复予以保留。
             高提供了帮助      [14−15] 。                                 经过上述步骤,得到次声信号共 2512 个,包含
                 尽管如此,由于多径效应以及不同类别次声事                          化爆次声信号 2107 个、地震次声信号 405 个,其中
   135   136   137   138   139   140   141   142   143   144   145