Page 191 - 《应用声学》2023年第3期
P. 191
第 42 卷 第 3 期 孟子轩等: 基于非负矩阵分解的次声信号分类方法 629
V ij V ij
− lg − 1, β = 0,
(W H) (W H)
ij ij
[ ]
(
)
D β V ij (W H) ij = V ij lg V ij − lg (W H) ij + (W H) − V ij , β = 1, (4)
ij
{ [ ]}
1 β β β−1
, otherwise,
V − (W H) − β(W H) ij V ij − (W H) ij
ij
ij
β(β − 1)
(
) ∑ (
)
且有 D β V W H = D β V ij (W H) ij 。当 对于不同的距离度量函数而言,其乘性更新法
β 6 1 时,式 (4) 为基于散度的度量;当 β > 1 时, 则可采用统一的形式给出 [13] :
[ ]
式 (4) 为基于范数的度量。特别地,当 β = 2 时, (W H) β−2 ◦ V H T
式 (4) 表示欧几里得距离。通常采用一种所谓乘性 W ← W ◦ β−1 ,
(W H) H T
更新规则的优化算法对式(3) 进行求解 [14] 。以欧几 [ ]
W T (W H) β−2 ◦ V
里得距离为例,优化算法目标函数为
H ← H ◦ β−1 , (14)
T
1 ∑ [ ] 2 W (W H)
J (W , H) = V ij − (W H) ij , (5)
2 式 (14) 中,β 的不同取值代表采用不同的距离度量
式 (5) 中,i = 1, 2, · · · , f;j = 1, 2, · · · , t。应用梯 函数,◦ 表示对矩阵元素的乘法,同时指数运算和除
度下降法对式 (5) 进行迭代求解,J (W , H) 分别对 法运算均表示对元素的运算。
W il 与H lj 的偏导数为 1.2 分类模型
∂J (W , H) [( T ) ( T ) ] 一个完整的识别分类系统如图 1 所示。分类模
=− V H − W HH , (6)
il il
∂W il 型的选择主要包括传统机器学习算法与深度神经
∂J (W , H) [ T T ] 网络两类。SVM 是一种广泛应用于次声信号识别
=− (W V ) lj − (W W H) lj , (7)
∂H lj
分类领域的机器学习模型,由于其分类面完全由支
其中,l = 1, 2, · · · , d,T表示矩阵转置。则基于梯度 持向量确定,因此在小样本场景下有较好的表现性
下降法的迭代规则,由式(6)和式(7)可得 能 [16] 。
[( T ) ( T ) ]
V H − W HH , (8)
W il = W il + λ il ᝫጷᬷ
il il
[ T T ]
H lj = H lj + µ lj (W V ) lj − (W W H) lj , (9)
ᮕܫေ ྲढ़ Ѭዝ٨ ᮕ
ଢԩ ፇ౧
其中,λ il 和 µ lj 是迭代步长。乘性更新法则对步长
进行限制,规定其取值为
W il តᬷ
λ il = , (10)
T
(W HH )
il
ᮕܫေ ྲढ़ Ѭዝ٨ ᮕ
H lj ଢԩ ፇ౧
µ lj = . (11)
T
(W W H)
lj
图 1 识别分类系统框图
将式 (10) 与式 (11) 分别带入式 (8) 与式 (9) 中,
Fig. 1 Block diagram of the classification system
得到欧几里得距离度量下的乘性更新法则:
( T ) SVM 的基本模型是定义在特征空间上的间隔
V H
il [14]
W il = W il , (12) 最大的二分类线性分类器 ,即求解如下的优化
T
(W HH )
il
( T ) 问题:
W V
lj
H lj = H lj T . (13) min 1 2 ( T ) (15)
(W W H) ∥w∥ s.t. y i w x i + b > 1,
lj w,b 2
式 (12) 与式 (13) 的非增性在文献 [15] 中得到了证 式(15)中,w 为分类超平面的法向量,x i 为第i个输
明。可以看出,采用式 (12)与式(13) 迭代求解式(3) 入,y i 为输入对应的标签,b则表示超平面的偏置量。
时只进行乘法和加法运算,从而保证了迭代过程及 式 (15) 是在数据集线性可分的情况下得到的,又被
结果的非负性。 称为线性可分 SVM。对于一般的线性不可分数据