Page 192 - 《应用声学》2023年第3期
P. 192

630                                                                                  2023 年 5 月


             集,通常是对式 (15) 添加惩罚项,允许部分样本不                        巧,可以得到更为一般的SVM形式,如下:
             满足约束,则式(15)可改写为
                                                                      1  ∑ ∑            (     )  ∑
                                                                                          T
                               ℓ                                  min         α i α j y i y j κ x x j −  α i ,
                  1     2    ∑ [( (           )    )]              α 2                    i
                                       T
              min   ∥w∥ + C        y i w x i + b − 1  , (16)             i  j                     i
              w,b 2                                                    ∑                                 (19)
                               i
                                                                  s. t.    α i y i = 0, 0 6 α 6 C,
             式 (16) 中,ℓ(·) 表示损失函数。若采用合页损失函                               i
             数,同时引入松弛变量 ξ i > 0,可以得到线性 SVM
             模型,如下:                                            式(19) 中,κ(·) 表示核函数。若选用线性核函数,则
                       1          ∑                            式(19) 退化为式 (18)。几种常用的核函数包括线性
                  min   ∥w∥ + C       ξ i ,
                            2
                  w,b,ξ i 2          i
                                                       (17)    核、高斯核、多项式核等,需在实际使用时进行选择。
                          T
                  s.t. y i (w x i + b) > 1 − ξ i , ξ i > 0.    以上提出的 SVM 均为二分类模型,对于 K 种类别
             采用拉格朗日乘子法,可以得到式(17)的对偶问题,                         的多分类问题,目前最常用的方法是分别构建K 个
             如下:                                               独立的 SVM    [17] :当训练第 k 个模型时,使用当前类
                    1  ∑ ∑                   ∑                 别y k 作为正样本数据,而将其余的K − 1 个类别作
                                       T
                min           α i α j y i y j x x j −  α i ,
                                       i
                 α 2     i   j                  i
                                                       (18)    为负样本。
                      ∑
                s. t.     α i y i = 0, 0 6 α 6 C,                  由于所提特征是一种二维数据,因此同时使
                         i
             式 (18) 中,α i 表示拉格朗日乘子。式 (15) 与式 (18)              用 CNN 进行分类。LeNet-5 是一种经典的 CNN 结
             到的 SVM 分类面均为线性分类面,通过采用核技                          构 [18−19] ,其网络结构如图2所示。
                  ᣥК                        ྲढ़ڏ
                                                                          ྲढ़ڏ
                  30T8                     5@15T4                        5@15T4
                               ྲढ़ڏ                       ྲढ़ڏ                           ˗ᫎࡏ  1  ˗ᫎࡏ 2
                              5@30T8                     5@30T8                          80     128  ᣥѣࡏ
                                                                    ෉ӑ                                4
                        Ԅሥ಩                                         2T2
                        2T2T5
                                          ෉ӑ
                                          2T2                                                    Лᤌଌࡏ


                                                     图 2  CNN 结构图
                                                Fig. 2 CNN structure diagram

                 LeNet-5 是一种较为浅层的 CNN,其输入经过                    准确的标注,经过准确标注的实测数据集为本研究
             两层卷积层、两层池化层后与全连接神经网络相连,                           奠定了重要的基础,有利于推动我国次声监测技术
             最后输出其类别概率。为保证泛化能力,每层网络                            的发展,对于自然灾害预警以及国防建设等领域具
             均添加正则化项,并采用Dropout进行随机失活。                         有重大意义。
                                                                   本文使用的数据为通过实地布阵自行采集的
             2 分类设计与实验结果分析                                     次声时域信号,数据集大小为 105 条,包括 4 种类型
                                                               的信号,其中爆炸信号 17 条,地震信号 22 条,闪电
             2.1 数据来源及预处理                                      信号41条,再入信号25条。本文采用原信号进行过
                 中国科学院声学研究所计划在全国范围内建                           STFT 后的时频图作为输入。4 类信号经 STFT 后
             设广域多台阵次声监测网络,现已在新疆、辽宁、云                           的时频图如图3所示。
             南等地建设了固定式次声台阵,并通过机动式次声                                图 3 所有标注出的红色方框区域均为信号部
             探测站对酒泉、文昌等发射基地的次声信号进行收                            分。就信号的频率维特征而言,爆炸事件与地震事
             集。通过逐步多通道相关方法等阵列处理算法得到                            件的主要频率分布在 5 Hz 以下,其中地震事件在
             每个信号的相速度、入射角和声源位置等声学参数,                           该频带中的分布比较均匀,而爆炸事件则分布在
             并结合声源信息的验证,对于信号的类别可以进行                            2 ∼ 4 Hz,相对集中;闪电事件的频带较宽,在20 Hz
   187   188   189   190   191   192   193   194   195   196   197