Page 127 - 《应用声学》2021年第1期
P. 127

第 40 卷 第 1 期             肖旭等: 基于多域特征提取和深度学习的声源被动测距                                          123


                 声源时域信号的幅度强弱变化和接收距离的                           1.1.2 时频联合域特征
             相关性较强,为提取描述声源信号幅度变化的特征,                               对原始信号进行 STFT,把每一帧进行快速傅
             对原始信号 s(t n ) 进行 Hilbert 变换,然后使用截止                里叶变换后的频域信号在时间上堆叠起来得到时
             频率为5 Hz的三阶Butterworth滤波器对振幅信号                     频谱 a k (t m ),其中 m 代表帧数,k 代表频点数。对
             进行低通滤波,得到信号振幅包络 e(t n )。估计信号                      a k (t m ) 进行标准化处理:
             的起始时间 t st 、激励阶段和下降阶段的终止时间                                                a k (t m )
             t Aend 、t Dend ,在此基础上定义时域的 7 个声学参数,                            p k (t m ) = ∑  a k (t m ) .  (4)
             如表 1 所示。其中,为了估计激励过程的时间长度,                                                  k
                                                               令第 k 个频点的频率为 f k ,得到谱的前四阶统计矩,
             定义对数激励时间为          [10]
                                                               分别定义为谱质心、谱延展、谱斜度和谱峰度                    [12] ,对
                         LAT = lg(t Aend − t st ).      (2)    于第m帧的频谱,表示为
                                                               
                                                                           ∑
             相对应地,将激励阶段和下降阶段能量的平均时间                             SC(t m ) =   f k p k (t m ),
                                                               
                                                               
                                                               
             斜率分别定义为激励斜率和下降斜率。估计振幅包                                        k
                                                               
                                                               
                                                                           (                         ) 1/2
                                                               
             络的最大值e max 。时间质心给出了信号能量质心所                                      ∑  (f k − µ 1 (t m )) · p k (t m )  ,
                                                               
                                                                                             2
                                                                SSP(t m ) =
                                                               
                                                               
             在的时刻,其定义式为          [11]                                         k
                                                                            (                         )
                                                                                                        /
                                 n 2                                         ∑
                                                                                                           3
                                                                                              3
                                                               
                                 ∑                              SSK(t m ) =     (f k − µ 1 (t m )) · p k (t m )  µ ,
                                    t n e(t n )                                                           2
                                                               
                                                               
                                                                              k
                                                                          (                         )
                                                               
                                n=n 1
                           t c =  ∑        ,            (3)                 ∑                         /
                                                               
                                                                                           4            4
                                     e(t n )                    SK(t m ) =     (f k − µ 1 (t m )) · p k (t m )  µ .
                                                               
                                                                                                         2
                                                               
                                  n                                           k
             其中,n 1 和 n 2 为声信号的起始和终止时间对应的                                                                 (5)
             索引号,以滤除前后的空白时间。当信号声能量大                                除了频谱的统计特征,根据频谱的斜率特征可
             于一定阈值 γe max 时,其持续时间定义为信号的有                       以从 STFT 能量谱中提取谱斜率、谱衰减                 [8] 、谱滚
             效时间,根据许多经验性的测试,γ 取 0.4 性能较稳                       降 [13] 、谱通量  [14] 。最后根据线谱特征提取信号的
             定,见文献[8]。除以上参数外,其余参数的公式定义                         平坦度及谱峰度        [8] ,其定义和物理含义如表 2 所示。
             可在文献 [8] 中一一得到。这些声学参数反映了声                         对于第m帧,上述物理量计算公式分别为
                                                                             ∑             ∑      ∑
             源的各种物理属性,例如对数激励时间反映了能量                                         K     f k a k (t m ) −  f k ·  a k (t m )
                                                               
                                                               
                                                               
             在上升过程中的时间长度,其与声源距离呈正相关,                                          k             k      k    ) ) ,
                                                               
                                                                SSL(t m ) =
                                                               
                                                                                    (           (        2
             声源距离越远,声信号需达到稳态振动的时间越长。                                       ∑            ∑    2    ∑    2
                                                               
                                                               
                                                                              a k (t m ) K  f −      f k
                                                                                              k
                                                               
             与波形包络相关的特征 (激励时间、时域质心等) 仅                                      k            k         k
                                                               
                                                               
                                                               
                                                                                     K
             适用于瞬态信号,分析连续声信号时,应提取自相关                                          1     ∑   a k (t m ) − a 1 (t m )
                                                               
                                                               
                                                                SD(t m ) = ∑                           ,
                                                               
             系数、载波信号调制和后文定义的频域特征。                                            a k (t m )  k=2  k − 1
                                                               
                                                               
                                                               
                                                               
                                                                           k
                                                               
                                                                                   f max
                                                                SR(t m )
                             表 1  时域特征                          ∑      2           ∑    2
                                                                       a (t m ) = 0.95  a (t m ),
                                                                        f
                                                                                         f
                       Table 1 Temporal features               
                                                                 f=0               f=0
                                                               
                                                                              ∑
                                                               
                                                                                   p k (t m ),
                                                                SV(t m ) = ∆f ·
                  声学参数      符号            定义                                     k
                                                               
                                                               
                                                               
                 自相关系数      AC   时域信号自相关系数                                  ( ∏        ) 1/K
                                                               
                                                               
                                                               
                  激励时间     ATT   激励过程的时间长度                                K      a k (t m )
                                                               
                                                                                k
                                                               
                  衰减时间     REL   衰减过程的时间长度                      SF(t m ) =    ∑             ,
                                                               
                                                                                  a k (t m )
                                                               
                对数激励时间     LAT   激励过程的时间长度的对数                                    k
                                                               
                                                               
                                                                                  a
                  激励斜率     ATK 激励阶段能量的平均时间斜率                               K max k(t m )
                                                               
                                                                                   k
                                                                                        ,
                                                                SCR(t m ) = ∑
                  下降斜率      DS   衰减阶段能量的平均时间斜率                                   a k (t m )
                                                               
                  时域质心      TC   信号能量包络的质心所在的时刻                                  k
                有效持续时间      ED   信号能量超过设定阈值的时间                                                            (6)
                  频率调制      FM   载波信号的频率                       其中,∆f 为信号 STFT 后两点的频率差,f max 为
                  振幅调制      AM   载波信号的幅度                                                          a
                                                               奈奎斯特采样决定的最高频率,max k(t m ) 是令
                                                                                                  k
   122   123   124   125   126   127   128   129   130   131   132