Page 183 - 《应用声学》2025年第1期
P. 183

第 44 卷 第 1 期              聂磊鑫等: 高斯过程辅助的船舶辐射噪声分类算法                                           179


                 从图 6 可以看出,使用增广数据集预训练得到                        下滑。这是因为不同类别的数据在扩增后产生的分
             的分类模型在各个测试 SNR 下都要优于在实测数                          布差异不同;对大类 2而言,由于大类内船型的构成
             据集上从头训练得到的分类模型。相比于只使用实                            更为复杂、类内差异大,更难以通过增广数据与实
             测数据集的方法,这种预训练-微调策略对加性噪声                           测数据采样自同一高斯过程的假定去弥补它们的
             的干扰也更加鲁棒。此现象说明,数据增广变换的                            分布差异。
             引入的确能够在一定程度上改善神经网络分类模
             型抗加性噪声干扰的能力;这种改善是由于数据增                                    1  0.475 ` 0.164 ` 0.191`  0.143`  0.027
             广变换在训练阶段给原始样本添加噪声的策略,它
             鼓励模型通过调整参数来抑制加性噪声对输出类                                     2  0.067 ` 0.682 ` 0.167`  0.046`  0.037
             别的影响,使得如此训练得到的模型在测试阶段能
             够应对一些加性的干扰。此外,图 6 也表明当测试                                ᄾࠄዝѿ  3  0.022 ` 0.062 ` 0.863`  0.036`  0.017
             SNR过低时,训练后的神经网络分类模型很难提供
             可靠的分类结果,因此在实践中使用这类方法时,需                                   4  0.047 ` 0.035 ` 0.077`  0.822`  0.019
             要一定的 SNR 才能保证方法输出的分类结果的可
             靠性。                                                       5  0.015 ` 0.019 ` 0.082`  0.049`  0.836
             4.3 所提算法带来的船舶辐射噪声分类性能增益                                       1     2      3     4     5
                                                                                     ᮕ฾ዝѿ
                 尽管通过预训练 -微调策略直接利用扩增后的                                              (a) ॲូኖ႕
             数据就可以促进分类模型在测试数据上的泛化性
             能,但增广数据集与原始实测数据集在数据分布上
                                                                       1  0.502 ` 0.159 ` 0.181`  0.147`  0.011
             通常会存在一定的差异;常规的微调策略在将模型
             从增广数据集迁移到实测数据集时并没有考虑到
                                                                       2  0.067 ` 0.670 ` 0.207`  0.038`  0.018
             这一点。通过显式进行域适应来对齐两个数据集的
             分布,能在迁移时更充分地利用增广数据集,因此它                                 ᄾࠄዝѿ  3  0.015 ` 0.043 ` 0.895`  0.034`  0.013
             是在数据扩增的基础上进一步改善分类模型泛化
             性能的一种潜在方案。接下来将通过实验验证所提                                    4  0.051 ` 0.031 ` 0.079`  0.833`  0.007
             的高斯过程辅助的域适应算法相比于常规的微调
             策略在分类性能上的优势。                                              5  0.025 ` 0.022 ` 0.064`  0.033`  0.856
                 四折交叉验证进行统计平均后,所提的域适
                                                                           1     2      3     4     5
             应算法能够在 ShipsEar数据上取得 0.781 的五分类                                         ᮕ฾ዝѿ
             准确率,而如 4.2 节所述,微调策略的分类准确率                                          (b) ਫ਼ଢ௭र۫ᤠऄካข
             为 0.762;显式对齐两个数据集的分布进一步带来                            图 7  在 ShipsEar 数据上使用增广数据预训练前后
             了 0.02 左右的显著性能增益。图 7 详细报告了这                          的性能
             两种迁移学习方法在 ShipsEar 上分类的混淆矩阵                          Fig. 7 Five-classification confusion matrices on
             (Confusion matrix, CFM)结果;对于CFM,其每一                  ShipsEar using two different training methods
             行代表真实的船舶类别,而每一列代表分类模型预                                此外,也将考察训练用的实测数据样本在
             测的船舶类别;矩阵中的每个数字表示相应的真实                            ShipsEar 可用数据的基础上进一步减少时,两种迁
             类别中模型预测正确的占比,因此矩阵每一行的求                            移学习策略的性能变化。在四折交叉验证中,将依
             和为 1。从CFM 的结果可以看出,尽管所提的域适                         据分段前的数据条划分为四等份,每份依次作为测
             应算法相比微调策略在整体上改善了分类准确率,                            试数据;训练评估每个模型时,使用剩余三份作为
             但这个改善是不均匀的。具体到每一类而言,大类1                           训练数据,这等效使用了全部实测数据条数的75%。
             和大类 3 得到了更多的准确率改善,大类 4 和大类5                       为了考虑在实测样本受限情况下的船舶辐射噪声
             的性能提升幅度相对较小,而大类 2 的性能则略有                          分类性能变化,在此进一步缩小训练神经网络时所
   178   179   180   181   182   183   184   185   186   187   188