Page 50 - 《应用声学》2020年第2期
P. 50
208 2020 年 3 月
首先要对次声信号进行检测,提取出疑似事件的数
0 引言
据。在实际应用过程中,已经研究出一些经典的检
将核爆炸或自然界事件信号从背景噪声中提 测方法,如基于 F-统计的 Fisher 检测算法 [2] 、互相
取出来,然后对事件信号进行分析识别,是核爆监测 关算法 [3] 、短时窗平均/长时窗平均(Short term av-
的基本内容之一。事件信号提取的方法主要是首先 eraging/long term averaging, STA/LTA) 算法、逐
通过滤波的方法降低噪声的干扰,然后采用信号检 次多通道互相关 (Progressive multi-channel corre-
测算法或人工的方法提取事件数据 [1] 。这些方法都 lation, PMCC) 检测算法 [4] 等。本文采用国际数据
需要根据实际噪声和信号的特点设置相应的阈值, 中心使用的 STA/LTA 算法,从次声传感器记录的
来对信号进行检测,而阈值的设定则依赖于研究人 数据中检测出可能的事件信号。
员对信号的分析结果或者经验,需要花费大量的时 STA/LTA 方法是由 Stevenson 提出,最先应用
间针对每一个不同的环境进行研究。即便如此,仍 于地震监测中,用来判定地震初至波的到达时间,
然会不可避免地将噪声检测为事件。 其基本原理为:用STA(短时窗平均值)和LTA(长时
随着核爆次声监测网络的建设,大量的实时监 窗平均值) 之比来反映信号幅度、频率等特征的变
测数据将源源不断地发送到数据处理中心,对这 化。当有事件信号到达时,STA/LTA值会发生突变,
些监测数据的实时分析需要一种有效的技术方法
通过设定一个阈值 R,根据当其比值是大于 R 或者
来支持,而机器学习的快速发展为解决这个问题提
小于R 来判定为事件信号或是噪声 [5−6] 。R 的计算
供了有效的手段,其中基于仿生学的人工神经网络
公式为
(Artificial neural network, ANN) 和基于统计学习
N
的支持向量机 (Support vector machine, SVM) 在 ∑
X(i)/N
解决实际问题中表现出良好的性能。 STA i=1
R = = , (1)
M
ANN作为一种通用的模式分类器,其泛化能力 LTA ∑
Y (j)/M
取决于样本的选取和模型的结构与参数,在实际应
j=1
用中不需要太多先验知识,但需要经过大量的实验
式(1) 中,X(i) (i = 1, 2, · · · , N)表示短时间窗内数
摸索,才能确定合适的神经网络模型以及相关参数
据;Y (j) (j = 1, 2, · · · , M) 表示长时间窗内的数据;
的设置,其分类效果与样本数量具有很大关系,需要
对模型不断优化来防止过拟合。 M 和 N 分别表示长、短时间窗内的样本数。如果 R
SVM是一种基于统计学习理论的分类方法,它 大于设定阈值,则认为该数据包含事件信号。
从理论上系统地研究了有限样本下经验风险与期 在实际中,检测阈值无法精确地给出,即使假
望风险的关系,能较好地解决小样本问题,通过将 设次声传感器记录的数据只包含背景噪声,此阈值
样本特征映射到高维空间,解决了非线性不可分的 也可能随着时间发生变化。当选择不同的阈值时,
问题,并利用内积核函数巧妙地解决了高维空间中 检测出的信号数量也大不相同,如图1所示。图1 中
计算复杂度剧增的问题;但对于大规模训练样本, 对节选的 2000 个数据点 (采样速率为 100 sps) 的次
SVM需要耗费大量的机器内存和运算时间。 声波形进行分析,当 R = 2 时,检测出信号的数量
本文对次声台站的单通道数据进行了信号检 为18次;当R = 3 时,检测出信号的数量为 6 次;当
测,采用 ANN 和 SVM 对信号和噪声进行了分类实 R = 4.5时,检测出信号的数量为2次。
验,对比分析了两种方法对次声事件的自动识别能 可以看出,阈值的选取对信号的检测有较大影
力,研究探索了提高它们的识别能力的方法,以期能 响,好的阈值可以过滤掉大部分的无用数据,减轻后
有效地应用到实际工程中去。 期数据分析的负担。当检测阈值设置过高时,采用
STA/LTA 算法的 Libinfra 软件检测率只有 41.18%
1 次声信号检测
[3]
(PMCC 算法的检测率为 94.12) 。但是,无论如何
次声波信号作为一种低频声信号,极易受到背 选取阈值,在长时间的监测过程中,都会产生大量的
景风和其他大气噪声的影响。在进行事件识别前, “事件信号”,需要进一步对这些信号进行识别。