Page 180 - 《应用声学》2025年第1期
P. 180

176                                                                                  2025 年 1 月


             借助超参数 α 权衡两部分的相对重要性,可将 l                   GP     不会既出现在训练集又出现在测试集。统计准确率
             写为                                                等分类性能指标时,将采用四折交叉验证的平均结
                                                               果;它会训练和测试 4次模型,使所有数据样本都有
                                   m
                                         c
                            l GP  = l + αl .           (23)
                                                               机会成为测试集,其中训练集与测试集的一次划分
                 总的来说,所提的训练策略在对网络模型参数                          被称为一折。
             进行取值优化时,除了通过 CE 损失函数缩小标签
             与模型预测的差异之外,也借助高斯过程,显式地对                              表 2   ShipsEar 实测数据上性能验证实验的基
                                                                  本设定
             齐增广数据和实测数据的分布。
                                                                  Table 2 The basic settings for the exper-
                                                                  iments on the ShipsEar dataset
             4 实验结果与分析
                                                                     设定项名称         单位            取值
             4.1 实验设定                                             采样率:原始/重采样        Hz        52734/32000

                 为了研究本文提出的高斯过程辅助的域适应                               分段:段长/段移          s           2/1
                                                                      分析带宽          Hz         100∼8100
             算法在训练数据有限的场景下对船舶辐射噪声分
                                                                   STFT:帧长/帧移       ms          100/25
             类的性能,本文在公开的海试数据 ShipsEar                [17]  上        STFT:窗函数                    汉明窗
             对方法进行实验验证。ShipsEar数据在采集时船舶                            时频谱图特征维度                    800 × 80
                                                                                              ResNet-18
             与水听器间距离较小,因此可近似认为是近场噪声,                                 特征提取器
                                                                                           (去除最后的 FC 层)
             其中共计包括五大类船舶辐射噪声,因此这是一个                                    分类器              FC 层 (512 维输入、5 维输出)
             五分类的任务。接下来将使用不同数量的每类真实                                优化器与学习率                   Adam 优化器
                                                                    数据批次大小                       128
             样本作为训练数据,分析讨论所提算法训练得到的
                                                                最大迭代轮数与早停轮数                     100/20
             模型的五分类性能变化。
                 来自 ShipsEar 的每一条实测船舶辐射噪声数                         实验中将离线地进行数据增广,会在交叉验证
             据通常会持续较长时间,在实验中将原始声压信号                            的每次训练前,对所有实测的训练数据进行扩增。
             切分成段,均值归零和标准差归一后利用 STFT 从                         每一条实测训练数据会被扩增至 n 条,以使增广数
             这些信号段中提取出时频谱图作为神经网络模型                             据集的尺寸是实测数据集的n 倍,其中 n 为整数,且
             输入。选用常见的 ResNet-18 架构          [21]  从模型输入        大于 1。若实测数据集包含 N r 条数据,则共计需要
             中提取抽象特征,然后利用单个 FC 层对这些特征                          进行 n · N r 次数据增广。每次扩增将均匀随机地选
             进行五分类。算法验证实验的设定细节如表2所示。                           取四种数据增广变换 (时间平移、时间掩蔽、添加随
                 对于 ShipsEar数据,五个类别包括的数据条数                     机噪声和 mixup) 中的一种,实际使用中这些数据

             目分别为 17、19、30、12 和 12;按照表 2 中的参数对                 增广变换的超参数设定如表 3所示。需要说明的是,
             数据条进行分段后,每个类别可以得到的总数据样                            对于时间平移和时间掩蔽的变换方法,实际使用时
             本(切分后的段) 数目分别为 1858、1541、4240、2443                为避免时频谱图缺失帧的填充值与谱图背景产生
             和 1128。为了避免过拟合,将以数据条为基础划分                         强烈的对比差异,通常填充的是时频谱图均值而不
             训练和测试集,这将确保同一条数据的不同切分段                            是零。


                                              表 3  四种数据增广变换的实施细节
                        Table 3 The implementation details of the four data augmentation operators

                               扩增变换             设定细节
                             时间平移 H 1 (·)       前向或后向移动 τ 帧,τ 在 1 到 40 间均匀随机取整数值
                                                掩蔽从 t 0 开始的 t 个连续时间帧,t 在 1 到 20 间均匀随机取整数值,
                             时间掩蔽 H 2 (·)
                                                t 0 随机取值且使得 t 0 + t 不超过 80 (总帧数)
                             加性噪声 H 3 (·)       信号加入高斯白噪声,SNR 在 0∼30 dB 内均匀随机取值
                            mixup 变换 H 4 (·)    混合参数 λ 随机取值,且 λ ∼ Beta(a, a),其中 a = 0.5
   175   176   177   178   179   180   181   182   183   184   185