Page 50 - 《应用声学》2020年第2期

P. 50

208 2020 年 3 月

首先要对次声信号进行检测，提取出疑似事件的数
0 引言
据。在实际应用过程中，已经研究出一些经典的检
将核爆炸或自然界事件信号从背景噪声中提测方法，如基于 F-统计的 Fisher 检测算法 [2] 、互相
取出来，然后对事件信号进行分析识别，是核爆监测关算法 [3] 、短时窗平均/长时窗平均(Short term av-
的基本内容之一。事件信号提取的方法主要是首先 eraging/long term averaging, STA/LTA) 算法、逐
通过滤波的方法降低噪声的干扰，然后采用信号检次多通道互相关 (Progressive multi-channel corre-
测算法或人工的方法提取事件数据 [1] 。这些方法都 lation, PMCC) 检测算法 [4] 等。本文采用国际数据
需要根据实际噪声和信号的特点设置相应的阈值，中心使用的 STA/LTA 算法，从次声传感器记录的
来对信号进行检测，而阈值的设定则依赖于研究人数据中检测出可能的事件信号。
员对信号的分析结果或者经验，需要花费大量的时 STA/LTA 方法是由 Stevenson 提出，最先应用
间针对每一个不同的环境进行研究。即便如此，仍于地震监测中，用来判定地震初至波的到达时间，
然会不可避免地将噪声检测为事件。其基本原理为：用STA(短时窗平均值)和LTA(长时
随着核爆次声监测网络的建设，大量的实时监窗平均值) 之比来反映信号幅度、频率等特征的变
测数据将源源不断地发送到数据处理中心，对这化。当有事件信号到达时，STA/LTA值会发生突变，
些监测数据的实时分析需要一种有效的技术方法
通过设定一个阈值 R，根据当其比值是大于 R 或者
来支持，而机器学习的快速发展为解决这个问题提
小于R 来判定为事件信号或是噪声 [5−6] 。R 的计算
供了有效的手段，其中基于仿生学的人工神经网络
公式为
(Artiﬁcial neural network, ANN) 和基于统计学习
N
的支持向量机 (Support vector machine, SVM) 在 ∑
X(i)/N
解决实际问题中表现出良好的性能。 STA i=1
R = = , (1)
M
ANN作为一种通用的模式分类器，其泛化能力 LTA ∑
Y (j)/M
取决于样本的选取和模型的结构与参数，在实际应
j=1
用中不需要太多先验知识，但需要经过大量的实验
式(1) 中，X(i) (i = 1, 2, · · · , N)表示短时间窗内数
摸索，才能确定合适的神经网络模型以及相关参数
据；Y (j) (j = 1, 2, · · · , M) 表示长时间窗内的数据；
的设置，其分类效果与样本数量具有很大关系，需要
对模型不断优化来防止过拟合。 M 和 N 分别表示长、短时间窗内的样本数。如果 R
SVM是一种基于统计学习理论的分类方法，它大于设定阈值，则认为该数据包含事件信号。
从理论上系统地研究了有限样本下经验风险与期在实际中，检测阈值无法精确地给出，即使假
望风险的关系，能较好地解决小样本问题，通过将设次声传感器记录的数据只包含背景噪声，此阈值
样本特征映射到高维空间，解决了非线性不可分的也可能随着时间发生变化。当选择不同的阈值时，
问题，并利用内积核函数巧妙地解决了高维空间中检测出的信号数量也大不相同，如图1所示。图1 中
计算复杂度剧增的问题；但对于大规模训练样本，对节选的 2000 个数据点 (采样速率为 100 sps) 的次
SVM需要耗费大量的机器内存和运算时间。声波形进行分析，当 R = 2 时，检测出信号的数量
本文对次声台站的单通道数据进行了信号检为18次；当R = 3 时，检测出信号的数量为 6 次；当
测，采用 ANN 和 SVM 对信号和噪声进行了分类实 R = 4.5时，检测出信号的数量为2次。
验，对比分析了两种方法对次声事件的自动识别能可以看出，阈值的选取对信号的检测有较大影
力，研究探索了提高它们的识别能力的方法，以期能响，好的阈值可以过滤掉大部分的无用数据，减轻后
有效地应用到实际工程中去。期数据分析的负担。当检测阈值设置过高时，采用

STA/LTA 算法的 Libinfra 软件检测率只有 41.18%
1 次声信号检测
[3]
(PMCC 算法的检测率为 94.12) 。但是，无论如何
次声波信号作为一种低频声信号，极易受到背选取阈值，在长时间的监测过程中，都会产生大量的
景风和其他大气噪声的影响。在进行事件识别前， “事件信号”，需要进一步对这些信号进行识别。

45 46 47 48 49 50 51 52 53 54 55