Page 183 - 《应用声学》2025年第1期
P. 183
第 44 卷 第 1 期 聂磊鑫等: 高斯过程辅助的船舶辐射噪声分类算法 179
从图 6 可以看出,使用增广数据集预训练得到 下滑。这是因为不同类别的数据在扩增后产生的分
的分类模型在各个测试 SNR 下都要优于在实测数 布差异不同;对大类 2而言,由于大类内船型的构成
据集上从头训练得到的分类模型。相比于只使用实 更为复杂、类内差异大,更难以通过增广数据与实
测数据集的方法,这种预训练-微调策略对加性噪声 测数据采样自同一高斯过程的假定去弥补它们的
的干扰也更加鲁棒。此现象说明,数据增广变换的 分布差异。
引入的确能够在一定程度上改善神经网络分类模
型抗加性噪声干扰的能力;这种改善是由于数据增 1 0.475 ` 0.164 ` 0.191` 0.143` 0.027
广变换在训练阶段给原始样本添加噪声的策略,它
鼓励模型通过调整参数来抑制加性噪声对输出类 2 0.067 ` 0.682 ` 0.167` 0.046` 0.037
别的影响,使得如此训练得到的模型在测试阶段能
够应对一些加性的干扰。此外,图 6 也表明当测试 ᄾࠄዝѿ 3 0.022 ` 0.062 ` 0.863` 0.036` 0.017
SNR过低时,训练后的神经网络分类模型很难提供
可靠的分类结果,因此在实践中使用这类方法时,需 4 0.047 ` 0.035 ` 0.077` 0.822` 0.019
要一定的 SNR 才能保证方法输出的分类结果的可
靠性。 5 0.015 ` 0.019 ` 0.082` 0.049` 0.836
4.3 所提算法带来的船舶辐射噪声分类性能增益 1 2 3 4 5
ᮕዝѿ
尽管通过预训练 -微调策略直接利用扩增后的 (a) ॲូኖ႕
数据就可以促进分类模型在测试数据上的泛化性
能,但增广数据集与原始实测数据集在数据分布上
1 0.502 ` 0.159 ` 0.181` 0.147` 0.011
通常会存在一定的差异;常规的微调策略在将模型
从增广数据集迁移到实测数据集时并没有考虑到
2 0.067 ` 0.670 ` 0.207` 0.038` 0.018
这一点。通过显式进行域适应来对齐两个数据集的
分布,能在迁移时更充分地利用增广数据集,因此它 ᄾࠄዝѿ 3 0.015 ` 0.043 ` 0.895` 0.034` 0.013
是在数据扩增的基础上进一步改善分类模型泛化
性能的一种潜在方案。接下来将通过实验验证所提 4 0.051 ` 0.031 ` 0.079` 0.833` 0.007
的高斯过程辅助的域适应算法相比于常规的微调
策略在分类性能上的优势。 5 0.025 ` 0.022 ` 0.064` 0.033` 0.856
四折交叉验证进行统计平均后,所提的域适
1 2 3 4 5
应算法能够在 ShipsEar数据上取得 0.781 的五分类 ᮕዝѿ
准确率,而如 4.2 节所述,微调策略的分类准确率 (b) ਫ਼ଢ௭र۫ᤠऄካข
为 0.762;显式对齐两个数据集的分布进一步带来 图 7 在 ShipsEar 数据上使用增广数据预训练前后
了 0.02 左右的显著性能增益。图 7 详细报告了这 的性能
两种迁移学习方法在 ShipsEar 上分类的混淆矩阵 Fig. 7 Five-classification confusion matrices on
(Confusion matrix, CFM)结果;对于CFM,其每一 ShipsEar using two different training methods
行代表真实的船舶类别,而每一列代表分类模型预 此外,也将考察训练用的实测数据样本在
测的船舶类别;矩阵中的每个数字表示相应的真实 ShipsEar 可用数据的基础上进一步减少时,两种迁
类别中模型预测正确的占比,因此矩阵每一行的求 移学习策略的性能变化。在四折交叉验证中,将依
和为 1。从CFM 的结果可以看出,尽管所提的域适 据分段前的数据条划分为四等份,每份依次作为测
应算法相比微调策略在整体上改善了分类准确率, 试数据;训练评估每个模型时,使用剩余三份作为
但这个改善是不均匀的。具体到每一类而言,大类1 训练数据,这等效使用了全部实测数据条数的75%。
和大类 3 得到了更多的准确率改善,大类 4 和大类5 为了考虑在实测样本受限情况下的船舶辐射噪声
的性能提升幅度相对较小,而大类 2 的性能则略有 分类性能变化,在此进一步缩小训练神经网络时所