Page 192 - 《应用声学》2023年第3期
P. 192
630 2023 年 5 月
集,通常是对式 (15) 添加惩罚项,允许部分样本不 巧,可以得到更为一般的SVM形式,如下:
满足约束,则式(15)可改写为
1 ∑ ∑ ( ) ∑
T
ℓ min α i α j y i y j κ x x j − α i ,
1 2 ∑ [( ( ) )] α 2 i
T
min ∥w∥ + C y i w x i + b − 1 , (16) i j i
w,b 2 ∑ (19)
i
s. t. α i y i = 0, 0 6 α 6 C,
式 (16) 中,ℓ(·) 表示损失函数。若采用合页损失函 i
数,同时引入松弛变量 ξ i > 0,可以得到线性 SVM
模型,如下: 式(19) 中,κ(·) 表示核函数。若选用线性核函数,则
1 ∑ 式(19) 退化为式 (18)。几种常用的核函数包括线性
min ∥w∥ + C ξ i ,
2
w,b,ξ i 2 i
(17) 核、高斯核、多项式核等,需在实际使用时进行选择。
T
s.t. y i (w x i + b) > 1 − ξ i , ξ i > 0. 以上提出的 SVM 均为二分类模型,对于 K 种类别
采用拉格朗日乘子法,可以得到式(17)的对偶问题, 的多分类问题,目前最常用的方法是分别构建K 个
如下: 独立的 SVM [17] :当训练第 k 个模型时,使用当前类
1 ∑ ∑ ∑ 别y k 作为正样本数据,而将其余的K − 1 个类别作
T
min α i α j y i y j x x j − α i ,
i
α 2 i j i
(18) 为负样本。
∑
s. t. α i y i = 0, 0 6 α 6 C, 由于所提特征是一种二维数据,因此同时使
i
式 (18) 中,α i 表示拉格朗日乘子。式 (15) 与式 (18) 用 CNN 进行分类。LeNet-5 是一种经典的 CNN 结
到的 SVM 分类面均为线性分类面,通过采用核技 构 [18−19] ,其网络结构如图2所示。
ᣥК ྲढ़ڏ
ྲढ़ڏ
30T8 5@15T4 5@15T4
ྲढ़ڏ ྲढ़ڏ ˗ᫎࡏ 1 ˗ᫎࡏ 2
5@30T8 5@30T8 80 128 ᣥѣࡏ
ӑ 4
Ԅሥ 2T2
2T2T5
ӑ
2T2 Лᤌଌࡏ
图 2 CNN 结构图
Fig. 2 CNN structure diagram
LeNet-5 是一种较为浅层的 CNN,其输入经过 准确的标注,经过准确标注的实测数据集为本研究
两层卷积层、两层池化层后与全连接神经网络相连, 奠定了重要的基础,有利于推动我国次声监测技术
最后输出其类别概率。为保证泛化能力,每层网络 的发展,对于自然灾害预警以及国防建设等领域具
均添加正则化项,并采用Dropout进行随机失活。 有重大意义。
本文使用的数据为通过实地布阵自行采集的
2 分类设计与实验结果分析 次声时域信号,数据集大小为 105 条,包括 4 种类型
的信号,其中爆炸信号 17 条,地震信号 22 条,闪电
2.1 数据来源及预处理 信号41条,再入信号25条。本文采用原信号进行过
中国科学院声学研究所计划在全国范围内建 STFT 后的时频图作为输入。4 类信号经 STFT 后
设广域多台阵次声监测网络,现已在新疆、辽宁、云 的时频图如图3所示。
南等地建设了固定式次声台阵,并通过机动式次声 图 3 所有标注出的红色方框区域均为信号部
探测站对酒泉、文昌等发射基地的次声信号进行收 分。就信号的频率维特征而言,爆炸事件与地震事
集。通过逐步多通道相关方法等阵列处理算法得到 件的主要频率分布在 5 Hz 以下,其中地震事件在
每个信号的相速度、入射角和声源位置等声学参数, 该频带中的分布比较均匀,而爆炸事件则分布在
并结合声源信息的验证,对于信号的类别可以进行 2 ∼ 4 Hz,相对集中;闪电事件的频带较宽,在20 Hz