Page 141 - 《应用声学》2021年第3期
P. 141
第 40 卷 第 3 期 谭笑枫等: 基于一维卷积神经网络的化爆和地震次声分类 459
每个信号包含完整的事件,长度为 3000 个点。为了 Welch平均周期法 [19] ,对次声事件原信号进行功率
保证数据平衡,采用降采样的方法,从 2107 个化爆 谱估计。把信号长度为 n 的数据分成 M 段,其中每
次声数据中随机抽取 410 个样本,与 405 个地震次 段长度为 N(允许存在重叠的部分),对每段信号分
声数据组成 815 个次声信号的原始数据集。其中的 别完成功率谱计算,取其结果的平均值得到功率谱
化爆和地震次声事件波形示意图如图1所示。 估计结果。根据经验,采用汉宁窗代替矩形窗,用于
解决旁瓣过大造成的功率谱的失真现象。每段功率
1.0
谱可以表示为 [20]
0.8 2
M−1
∑ x (n)d(n) e −j2πfn , (1)
i
i
1
(f) =
P
ॆʷӑηՂࣨए 0.6 其中,n 代表次声信号采样数据点数,U 表示归一化
PER
MU
n=0
0.4
具体表示为
0.2 因子,目的是为使得到的功率谱为接近无偏估计。
M−1
1 ∑
0 2 (2)
0 1000 2000 3000 U = d (n) ,
ηՂ᫂ए M n=0
(a) ӑྐܦฉॎ 其中,d(n)为汉宁窗,因此,平均功率谱可以由式 (3)
1.0
表示:
0.8 P PER (f) = 2
ॆʷӑηՂࣨए 0.6 MUL ∑ ∑ x (n)d (n) e −j2πfn . (3)
L M−1
1
2
i
i=1
n=0
0.4
0.2 可以把功率谱转换为分贝表示 ) [21] ]
(
[
P PER (dB) = 10 lg P/1 m/s 2 · Hz −1 . (4)
0 通过上述方法,可以将次声信号原始数据进行
0 1000 2000 3000
ηՂ᫂ए
功率谱估计。本文对信号进行平均采样,每段次声
(b) ڡܦฉॎ
信号 x(n) 为 3000 个采样点,将数据进行分段处理。
图 1 两类次声事件波形示意图 经过功率谱计算后,就把3000 个点的时域次声信号
Fig. 1 Two types of infrasound event waveform x(n) 处理为频率范围在 0–10 Hz 的功率谱值。图 2
diagram
即表示化爆和地震次声的Welch功率谱示意图。
利用 815 个次声事件信号建立数据集。数据集 从图 2 可以看出,化爆的功率谱值主要集中
包括训练集、验证集和测试集,分别用于网络模型 在 0.3 ∼ 0.6 之间, 地震的功率谱值主要集中在
的训练、验证和测试。3个集合分别包含地震样本和 0.35 ∼ 0.65 之间,两类事件的功率谱值在范围和
化爆次声样本。在保证训练集、验证集和测试集中 趋势上存在差异。
两类样本数量大致相同的情况下进行随机抽取,按 将 1.1 节 建 立 的 数 据 集 中 的 次 声 数 据 进 行
照训练集样本数量占比 80%、验证集和测试集样本 Welch 功率谱估计特征提取,得到所有次声信号
数量各占比10%,即三者比值为8:1:1建立数据集。 样本的功率谱特征。
1.2 数据预处理 1.2.2 提取IMF分量比特征
1.2.1 提取功率谱特征 将次声信号进行 EMD 分解,可以得到次声信
功率谱作为声学信号分析的重要方法,表示了 号的n阶IMF分量和一个残差量。计算每个IMF分
信号功率随着频率的变化关系,将其作为特征能够 量的能量,可以筛选出能量最大的前 m 个分量,m
更好地凸显出地震和化爆信号的差异。本文采用 个分量的总能量大于等于整体能量的85%以上。将