Page 50 - 《应用声学》2020年第2期
P. 50

208                                                                                  2020 年 3 月


                                                               首先要对次声信号进行检测,提取出疑似事件的数
             0 引言
                                                               据。在实际应用过程中,已经研究出一些经典的检
                 将核爆炸或自然界事件信号从背景噪声中提                           测方法,如基于 F-统计的 Fisher 检测算法             [2] 、互相
             取出来,然后对事件信号进行分析识别,是核爆监测                           关算法    [3] 、短时窗平均/长时窗平均(Short term av-
             的基本内容之一。事件信号提取的方法主要是首先                            eraging/long term averaging, STA/LTA) 算法、逐
             通过滤波的方法降低噪声的干扰,然后采用信号检                            次多通道互相关 (Progressive multi-channel corre-
             测算法或人工的方法提取事件数据                [1] 。这些方法都         lation, PMCC) 检测算法     [4]  等。本文采用国际数据
             需要根据实际噪声和信号的特点设置相应的阈值,                            中心使用的 STA/LTA 算法,从次声传感器记录的
             来对信号进行检测,而阈值的设定则依赖于研究人                            数据中检测出可能的事件信号。
             员对信号的分析结果或者经验,需要花费大量的时                                STA/LTA 方法是由 Stevenson 提出,最先应用
             间针对每一个不同的环境进行研究。即便如此,仍                            于地震监测中,用来判定地震初至波的到达时间,
             然会不可避免地将噪声检测为事件。                                  其基本原理为:用STA(短时窗平均值)和LTA(长时
                 随着核爆次声监测网络的建设,大量的实时监                          窗平均值) 之比来反映信号幅度、频率等特征的变
             测数据将源源不断地发送到数据处理中心,对这                             化。当有事件信号到达时,STA/LTA值会发生突变,
             些监测数据的实时分析需要一种有效的技术方法
                                                               通过设定一个阈值 R,根据当其比值是大于 R 或者
             来支持,而机器学习的快速发展为解决这个问题提
                                                               小于R 来判定为事件信号或是噪声                [5−6] 。R 的计算
             供了有效的手段,其中基于仿生学的人工神经网络
                                                               公式为
             (Artificial neural network, ANN) 和基于统计学习
                                                                                       N
             的支持向量机 (Support vector machine, SVM) 在                                   ∑
                                                                                          X(i)/N
             解决实际问题中表现出良好的性能。                                                  STA     i=1
                                                                          R =       =            ,        (1)
                                                                                       M
                 ANN作为一种通用的模式分类器,其泛化能力                                         LTA    ∑
                                                                                          Y (j)/M
             取决于样本的选取和模型的结构与参数,在实际应
                                                                                      j=1
             用中不需要太多先验知识,但需要经过大量的实验
                                                               式(1) 中,X(i) (i = 1, 2, · · · , N)表示短时间窗内数
             摸索,才能确定合适的神经网络模型以及相关参数
                                                               据;Y (j) (j = 1, 2, · · · , M) 表示长时间窗内的数据;
             的设置,其分类效果与样本数量具有很大关系,需要
             对模型不断优化来防止过拟合。                                    M 和 N 分别表示长、短时间窗内的样本数。如果 R
                 SVM是一种基于统计学习理论的分类方法,它                         大于设定阈值,则认为该数据包含事件信号。
             从理论上系统地研究了有限样本下经验风险与期                                 在实际中,检测阈值无法精确地给出,即使假
             望风险的关系,能较好地解决小样本问题,通过将                            设次声传感器记录的数据只包含背景噪声,此阈值
             样本特征映射到高维空间,解决了非线性不可分的                            也可能随着时间发生变化。当选择不同的阈值时,
             问题,并利用内积核函数巧妙地解决了高维空间中                            检测出的信号数量也大不相同,如图1所示。图1 中
             计算复杂度剧增的问题;但对于大规模训练样本,                            对节选的 2000 个数据点 (采样速率为 100 sps) 的次
             SVM需要耗费大量的机器内存和运算时间。                              声波形进行分析,当 R = 2 时,检测出信号的数量
                 本文对次声台站的单通道数据进行了信号检                           为18次;当R = 3 时,检测出信号的数量为 6 次;当
             测,采用 ANN 和 SVM 对信号和噪声进行了分类实                       R = 4.5时,检测出信号的数量为2次。
             验,对比分析了两种方法对次声事件的自动识别能                                可以看出,阈值的选取对信号的检测有较大影
             力,研究探索了提高它们的识别能力的方法,以期能                           响,好的阈值可以过滤掉大部分的无用数据,减轻后
             有效地应用到实际工程中去。                                     期数据分析的负担。当检测阈值设置过高时,采用

                                                               STA/LTA 算法的 Libinfra 软件检测率只有 41.18%
             1 次声信号检测
                                                                                           [3]
                                                               (PMCC 算法的检测率为 94.12) 。但是,无论如何
                 次声波信号作为一种低频声信号,极易受到背                          选取阈值,在长时间的监测过程中,都会产生大量的
             景风和其他大气噪声的影响。在进行事件识别前,                            “事件信号”,需要进一步对这些信号进行识别。
   45   46   47   48   49   50   51   52   53   54   55