Page 190 - 《应用声学》2023年第3期
P. 190

628                                                                                  2023 年 5 月


                                                               声波的产生和传播机理研究以及次声事件的影响
             0 引言
                                                               和防治策略都有重要意义。特别是本研究使用的
                 次声是指频率低于 20 Hz 的声信号。自然环境                      NMF 方法处理结果是在可靠的先验信息标注的多
             与人类社会中广泛存在着次声信号,许多物理现象                            条数据库上获得的,其目的在于提取目标信号的基
             在发生和发展过程中都会伴随低频次声信号的产                             本组成部分,分别作为不同类信号的特征。特征提
             生,例如自然活动中的地震、台风、闪电、火山喷发                           取后使用 SVM 等分类器完成识别分类任务,是次
             和海啸以及人类活动中的核和化学爆炸、火箭发射、                           声监测的重要环节,也是大气次声学的一项基础性
             飞机起飞等事件        [1] 。从灾害预防的角度看,对次声                 研究。
             信号的识别分类能够起到预警的作用;在军事对抗
             领域,通过次声信号来识别敌对方的军事活动对国                            1 特征提取算法及分类模型
             防安全具有十分重要的意义。
                                                               1.1  NMF理论
                 自 1996 年全面禁止核试验条约组织 (Com-
                                                                   NMF 是一种广泛应用于图像识别、语声增强
             prehensive nuclear-test-ban treaty organization,
                                                               以及声事件识别等领域的算法               [8−10] ,其基本框架由
             CTBTO) 成立以来,次声成为国际监测系统 (In-
             ternational monitoring system, IMS)所使用的4种         Lee 等  [11]  提出。定义非负矩阵 V ∈ R       f×t ,此处非
             主要监测核爆的手段之一,利用机器学习方法对次                            负的含义是指 V 中的任一元素 V ij > 0。NMF 的目
             声信号进行识别分类的研究也由此展开                   [2] 。对于次      的是希望得到两个非负矩阵 W 与 H,同时保证二
             声信号的识别分类任务而言,由于样本数量较少,因                           者乘积与一个V 尽可能接近:
             此研究的关键问题在于信号的特征提取                   [3−4] 。吴涢                       V ≈ W H.                 (1)
             晖  [5]  采用了 8 种不同的特征提取方式对化学爆炸、
                                                                   在本文中,V 为原信号经短时傅里叶变换
             闪电和台风 3 类事件进行处理,对比了支持向量机
             (Support vector machines, SVM)、BP神经网络、长           (Short-time Fourier transform, STFT) 后得到的时
             短时神经网络和卷积神经网络(Convolutional neu-                  频图,而 W ∈ R     f×d  与 H ∈ R d×t  则表示经训练后
             ral network, CNN) 4 种分类器的分类性能,结果表                 从数据中学习到的特征,其具体含义往往与实际问
             明SVM的识别性能最好。同时指出,其构建的分类                           题相关。W 可以认为是 V 中的基本组成部分,被
             流程对人工设计的特征有较高的要求,需要研究人                            称为字典矩阵,其列向量被称为字典原子;而 H 被
             员对各种信号的特征进行深入的研究和挑选,以找                            称为激活矩阵,表示在 V 中这些部分在相应时间
             出区分度较大的特征。                                        点上的线性组合计权,其行向量被称为字典原子的
                 谭笑枫等     [6]  以数据驱动为出发点,采用 CNN                激活系数;参数 d 则表示字典矩阵中字典原子的个
             进行特征提取、模型训练和识别分类,以简化特征                            数 [12−13] ,此时有
             设计过程,其提出的方法在 CTBTO 提供的化爆与
                                                                       V = w 1 h 1 + w 2 h 2 + · · · + w d h d ,  (2)
             地震两类次声数据集上达到了82.72%的准确率,但
             该方法对数据量的要求较高,难以应用于小样本数                            式 (2) 中,w i 与 h i 分别为字典原子与相应的激活系
             据集的情况。本文从矩阵分解的角度,考虑采用浅                            数。由于通常设定 d ≪ min(f, t),即只用很少的字
             层的模型对次声信号进行特征提取,以适用于小样                            典原子来描述原信号,因此只有在 W 包含了原信
             本场景下的次声信号分类任务。                                    号中最主要的组成时,才会使得式(1)成立                  [12] ,本文
                 戴翊靖等     [7]  考虑到次声信号特性与样本量小                  将这些表示原信号基本部分的字典原子作为特征
             的特点,采用非负矩阵分解 (Non-negative matrix                 输入,采用SVM等分类器进行识别分类任务。
             factorization, NMF) 进行次声降噪。该方法的研究                     W 和 H 可通过最小化 V 与 W H 之间的距离
             对象为一段混合的次声信号,将预训练的平稳噪声                            度量函数得到,即求解如下的优化问题                  [11] :
             作为监督项,通过 NMF 方法将信号中的目标部分
                                                                       min D(V ∥W H) s.t. W , H > 0,      (3)
             与噪声部分分离,然后恢复目标信号。其目的在于                                   W ,H
             获得较高信噪比的目标信号,以便于后续的次声监                            式 (3) 中,D 表示 V 与 W H 之间的距离度量函数,
             测任务。本文聚焦于分类的具体应用,对于大气次                            其定义为
   185   186   187   188   189   190   191   192   193   194   195