Page 180 - 《应用声学》2025年第1期
P. 180
176 2025 年 1 月
借助超参数 α 权衡两部分的相对重要性,可将 l GP 不会既出现在训练集又出现在测试集。统计准确率
写为 等分类性能指标时,将采用四折交叉验证的平均结
果;它会训练和测试 4次模型,使所有数据样本都有
m
c
l GP = l + αl . (23)
机会成为测试集,其中训练集与测试集的一次划分
总的来说,所提的训练策略在对网络模型参数 被称为一折。
进行取值优化时,除了通过 CE 损失函数缩小标签
与模型预测的差异之外,也借助高斯过程,显式地对 表 2 ShipsEar 实测数据上性能验证实验的基
本设定
齐增广数据和实测数据的分布。
Table 2 The basic settings for the exper-
iments on the ShipsEar dataset
4 实验结果与分析
设定项名称 单位 取值
4.1 实验设定 采样率:原始/重采样 Hz 52734/32000
为了研究本文提出的高斯过程辅助的域适应 分段:段长/段移 s 2/1
分析带宽 Hz 100∼8100
算法在训练数据有限的场景下对船舶辐射噪声分
STFT:帧长/帧移 ms 100/25
类的性能,本文在公开的海试数据 ShipsEar [17] 上 STFT:窗函数 汉明窗
对方法进行实验验证。ShipsEar数据在采集时船舶 时频谱图特征维度 800 × 80
ResNet-18
与水听器间距离较小,因此可近似认为是近场噪声, 特征提取器
(去除最后的 FC 层)
其中共计包括五大类船舶辐射噪声,因此这是一个 分类器 FC 层 (512 维输入、5 维输出)
五分类的任务。接下来将使用不同数量的每类真实 优化器与学习率 Adam 优化器
数据批次大小 128
样本作为训练数据,分析讨论所提算法训练得到的
最大迭代轮数与早停轮数 100/20
模型的五分类性能变化。
来自 ShipsEar 的每一条实测船舶辐射噪声数 实验中将离线地进行数据增广,会在交叉验证
据通常会持续较长时间,在实验中将原始声压信号 的每次训练前,对所有实测的训练数据进行扩增。
切分成段,均值归零和标准差归一后利用 STFT 从 每一条实测训练数据会被扩增至 n 条,以使增广数
这些信号段中提取出时频谱图作为神经网络模型 据集的尺寸是实测数据集的n 倍,其中 n 为整数,且
输入。选用常见的 ResNet-18 架构 [21] 从模型输入 大于 1。若实测数据集包含 N r 条数据,则共计需要
中提取抽象特征,然后利用单个 FC 层对这些特征 进行 n · N r 次数据增广。每次扩增将均匀随机地选
进行五分类。算法验证实验的设定细节如表2所示。 取四种数据增广变换 (时间平移、时间掩蔽、添加随
对于 ShipsEar数据,五个类别包括的数据条数 机噪声和 mixup) 中的一种,实际使用中这些数据
目分别为 17、19、30、12 和 12;按照表 2 中的参数对 增广变换的超参数设定如表 3所示。需要说明的是,
数据条进行分段后,每个类别可以得到的总数据样 对于时间平移和时间掩蔽的变换方法,实际使用时
本(切分后的段) 数目分别为 1858、1541、4240、2443 为避免时频谱图缺失帧的填充值与谱图背景产生
和 1128。为了避免过拟合,将以数据条为基础划分 强烈的对比差异,通常填充的是时频谱图均值而不
训练和测试集,这将确保同一条数据的不同切分段 是零。
表 3 四种数据增广变换的实施细节
Table 3 The implementation details of the four data augmentation operators
扩增变换 设定细节
时间平移 H 1 (·) 前向或后向移动 τ 帧,τ 在 1 到 40 间均匀随机取整数值
掩蔽从 t 0 开始的 t 个连续时间帧,t 在 1 到 20 间均匀随机取整数值,
时间掩蔽 H 2 (·)
t 0 随机取值且使得 t 0 + t 不超过 80 (总帧数)
加性噪声 H 3 (·) 信号加入高斯白噪声,SNR 在 0∼30 dB 内均匀随机取值
mixup 变换 H 4 (·) 混合参数 λ 随机取值,且 λ ∼ Beta(a, a),其中 a = 0.5