Page 165 - 《应用声学》2022年第5期
P. 165
第 41 卷 第 5 期 吴情等: 基于深度学习的语声抑郁识别 841
(6) Coverap:将数据集里自带的声频 Coverap 时提高了 2.5%,F1 分数达到 74%,比不加时提高了
特征结合参与者和采访者的对话内容记录,将只 12%;Opensmile 的精确度达到 76.16%,比不加时
有参与者声频的 Coverap 特征提取出来,特征包含 提高了 2.48%,F1 分数达到 76%,比不加时提高了
基频、发声/不发声,归一化幅度参数、拟开熵、前 13%;语谱图的精确度也提高了1.92%,F1分数提高
两次谐波的振幅差异化声门的源谱、抛物面反射光 了8.44%。由此可得出,注意力机制对于分类结果指
谱参数、最大分散熵、峰值斜率、声门脉冲动力学、 标都有一定幅度的提高。
Rd_conf、0 ∼ 24阶MFCC、谐波模型和相位畸变均
表 2 不同的手工特征在加注意力的 LSTM 模
值,最后每个声频得到(帧数,74)维数据。
型上的性能对比
2.3.2 实验测试 Table 2 Performance comparison of dif-
实验1 结合注意力机制的BLSTM算法 ferent manual features in the attention-
added LSTM model
用上述提取的手工特征,分别送进结合注意力
机制的 LSTM 模型中对抑郁症进行分类,观察实验 特征 精确度 F1 分数 召回率
结果,模型如图3所示。以不加注意力机制的LSTM MFCC 0.7719 0.74 0.7383
模型做实验对比 (不加注意力机制模型除少了注意 Opensmile 0.7616 0.76 0.7657
力机制模型外,其他参数和图 3 均相同),实验结果 语谱图 0.7446 0.6654 0.7067
如表1和表2所示。 Covarep 0.7358 0.6350 0.6516
共振峰 0.6618 0.58 0.5795
ྲढ़ଢԩ 基频 0.6962 0.6962 0.55
MFCC
Opensmile
Melឦ៨ڏ LSTM-40 LSTM-30 LSTM-20 Attention FC-15 FC-10 softmax 实验 2 CNN 和结合注意力机制的 BLSTM 特
Covarep
С 征融合算法
۳ᮠ
实验1得出,在所研究的手工特征中,MFCC的
图 3 手工特征结合注意力机制的 LSTM 模型 效果最好,所以在实验 2 中,采用 MFCC 特征来进
Fig. 3 LSTM model of manual features combined 行实验,实验结果如表3所示。
with attention mechanism
表 3 MFCC 在基于 CNN 和结合注意力机制
表 1 不同的手工特征在没加注意力的 LSTM 的 BLSTM 特征融合模型上的性能
模型上的性能对比 Table 3 Performance of MFCC in BLSTM
Table 1 The performance comparison of feature fusion model based on CNN and
different manual features on the LSTM combining attention mechanism
model without attention
特征 精确度 F1 分数 召回率
特征 精确度 F1 分数 召回率
MFCC 0.7806 0.7468 0.7653
MFCC 0.7469 0.62 0.67
Opensmile 0.7365 0.63 0.74 从表 3 的结果可以看出,由于实验 2 比实验 1
语谱图 0.7254 0.581 0.6022 多了一条 CNN 支路以获取空间信息,对于语声信
Covarep 0.6884 0.5884 0.5995
号的抑郁识别效果有了一定的提升,模型精确度
共振峰 0.6302 0.5542 0.5898
达到 78.06%,比实验 1 提高了 0.87%;F1 分数达到
基频 0.6688 0.5224 0.6979
74.68%,比实验1提高了0.68%。
从表 1 和表 2 中可以看出,对于所探究的 6 个 从两个实验和前人研究的结果中都可以看出,
特征而言,网络加上注意力机制之后,分类效果都 在语声抑郁识别的众多声频特征中,MFCC 相对其
有一定的提高,其中 MFCC、Opensmile、语谱图这 他手工特征而言效果都是较好的,可能是因为梅尔
3 种特征对于语声抑郁识别有着较好的结果。加注 频率反映了人耳的感知频率与声音的真实频率之
意力机制时,MFCC 的精确度达到 77.19%,比不加 间的关系,而MFCC就是在梅尔频谱的基础上提取