Page 21 - 《应用声学》2024年第6期
P. 21
第 43 卷 第 6 期 赵子杰等: 应用原型网络的小样本次声信号分类识别方法 1197
o t = σ (W o · [h t−1 , x t ] + b o ) , (8) (3) 在有标签的情况下,对同一标签类别的样
h t = o t ∗ tanh (C t ) . (9) 本求均值,得到各类次声事件的原型表示;
(4) 对每个样本的嵌入表示与各类次声事件的
次 声 信 号 以 帧 级 为 单 位 输 入 至 编 码 单 元 原型表示作度量计算;
LSTM 中,可建立针对于次声信号的长期的上下 (5) 根据度量计算的结果,对各个训练样本进
文关系,即充分利用当前次声信号帧与先前次声信 行预测,得到预测标签;
号帧的特征关系。同时可以采用LSTM作为原型网 (6) 将预测标签与真实标签做交叉熵损失,根
络的编码单元,可以灵活地处理不同长度的次声信 据交叉熵损失进行优化;
号序列,提高了次声信号编码的适应性和泛化能力。 (7) 优化至收敛后,最终得到各类次声事件的
原型表示。
1.3 次声信号分类器训练流程
测试阶段:
常见的多分类器训练方法为设置训练集和测 (1) 将预处理后的待测样本数据输入至在训练
试集,通过训练集对应用原型度量方法的次声信号 阶段训练好的 LSTM 中,得到各帧特征对应的隐层
分类器进行优化,并在测试集中验证次声信号分类 输出;
器的效果。程序流程如图4所示。 (2) 待测样本数据的最后一帧的隐层输出作为
训练阶段: 该数据的嵌入表示;
(1) 预处理后的训练集数据有着不同的帧数, (3) 将待测样本数据的嵌入表示与训练阶段得
将这些数据输入至 LSTM 中,数据的每帧特征都会 到的各类次声事件的最终原型表示作度量计算;
得到对应的隐层输出; (4) 根据度量计算的结果,对待测样本进行预
(2) 每个样本数据的最后一帧的隐层输出作为 测,得到该次声信号分类器对该待测样本的预测
该数据的嵌入表示进行后续操作; 标签。
ನవ 1 ನవ 2 ನవ n តನవ
ྲ ྲ ྲ ྲ ྲ ྲ ྲ ྲ ྲ
ढ़ ढ़ ... ढ़ ढ़ ढ़ ... ढ़ ... ढ़ ढ़ ... ढ़
1 2 k 1 1 2 k 2 1 2 k n
Basic LSTM
ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ ࢦ
͖ӑ٨ К К ... К К К ... К К К ... К К К ... К
Ք Ք Ք Ք Ք Ք Ք Ք Ք Ք Ք Ք
᧚ ᧚ ᧚ ᧚ ᧚ ᧚ ... ᧚ ᧚ ᧚ ᧚ ᧚ ᧚
1 2 k 1 1 2 k 2 1 2 k n 1 2 k t
ࢦКՔ᧚ k 1 ࢦКՔ᧚ k 2 ࢦКՔ᧚ k n ࢦКՔ᧚ k t
ዝѿ1 ዝѿ2
Տዝکϙ
ᡰሏᝠካ
Ԕی1 Ԕی2
arg max p φ ↼y/kx↽
k
图 4 原型度量次声分类程序流程图
Fig. 4 Flow chart of infrasound classification by prototype metric