Page 21 - 《应用声学》2024年第6期
P. 21

第 43 卷 第 6 期            赵子杰等: 应用原型网络的小样本次声信号分类识别方法                                         1197


                       o t = σ (W o · [h t−1 , x t ] + b o ) ,  (8)  (3) 在有标签的情况下,对同一标签类别的样
                       h t = o t ∗ tanh (C t ) .        (9)    本求均值,得到各类次声事件的原型表示;
                                                                   (4) 对每个样本的嵌入表示与各类次声事件的
                 次 声 信 号 以 帧 级 为 单 位 输 入 至 编 码 单 元             原型表示作度量计算;
             LSTM 中,可建立针对于次声信号的长期的上下                               (5) 根据度量计算的结果,对各个训练样本进
             文关系,即充分利用当前次声信号帧与先前次声信                            行预测,得到预测标签;
             号帧的特征关系。同时可以采用LSTM作为原型网                               (6) 将预测标签与真实标签做交叉熵损失,根
             络的编码单元,可以灵活地处理不同长度的次声信                            据交叉熵损失进行优化;
             号序列,提高了次声信号编码的适应性和泛化能力。                               (7) 优化至收敛后,最终得到各类次声事件的
                                                               原型表示。
             1.3 次声信号分类器训练流程
                                                                   测试阶段:
                 常见的多分类器训练方法为设置训练集和测                               (1) 将预处理后的待测样本数据输入至在训练
             试集,通过训练集对应用原型度量方法的次声信号                            阶段训练好的 LSTM 中,得到各帧特征对应的隐层
             分类器进行优化,并在测试集中验证次声信号分类                            输出;
             器的效果。程序流程如图4所示。                                       (2) 待测样本数据的最后一帧的隐层输出作为
                 训练阶段:                                         该数据的嵌入表示;
                 (1) 预处理后的训练集数据有着不同的帧数,                            (3) 将待测样本数据的嵌入表示与训练阶段得
             将这些数据输入至 LSTM 中,数据的每帧特征都会                         到的各类次声事件的最终原型表示作度量计算;
             得到对应的隐层输出;                                            (4) 根据度量计算的结果,对待测样本进行预
                 (2) 每个样本数据的最后一帧的隐层输出作为                        测,得到该次声信号分类器对该待测样本的预测
             该数据的嵌入表示进行后续操作;                                   标签。


                                     ನవ 1           ನవ 2                 ನవ n                 ฾តನవ
                                  ྲ ྲ     ྲ     ྲ ྲ         ྲ         ྲ ྲ       ྲ
                                  ढ़ ढ़  ...  ढ़   ढ़ ढ़   ...   ढ़   ...   ढ़ ढ़  ...  ढ़
                                  1  2    k 1   1  2        k 2       1  2      k n


                                                               Basic LSTM


                                  ࢦ ࢦ     ࢦ     ࢦ ࢦ          ࢦ        ࢦ ࢦ      ࢦ            ࢦ ࢦ      ࢦ
                      ͖ӑ٨         К К  ...  К   К К  ...     К        К К  ...  К           К К  ...  К
                                  Ք Ք     Ք     Ք Ք          Ք        Ք Ք      Ք            Ք Ք      Ք
                                  ᧚ ᧚     ᧚     ᧚ ᧚          ᧚   ...  ᧚ ᧚      ᧚            ᧚ ᧚      ᧚
                                  1  2    k 1   1  2         k 2       1 2     k n          1 2      k t


                                   ࢦКՔ᧚ k 1        ࢦКՔ᧚ k 2             ࢦКՔ᧚ k n              ࢦКՔ᧚ k t
                                               ዝѿ1                    ዝѿ2

                                                         Տዝکϙ

                                                                                    ᡰሏᝠካ
                                                  Ԕی1            Ԕی2

                                                     arg max  p φ  ↼y/kx↽
                                                       k
                                               图 4  原型度量次声分类程序流程图
                                  Fig. 4 Flow chart of infrasound classification by prototype metric
   16   17   18   19   20   21   22   23   24   25   26