Page 62 - 《应用声学》2022年第3期
P. 62

384                                                                                  2022 年 5 月


             础  [18] 。鸣声端点检测通过从含有背景噪声的鸟鸣                       声的实验研究表明,大多数鸟鸣声频谱存在明显的
             声信号中确定鸣声起止点,准确的端点检测能够提                            子带峰值     [21−24] ,本文采用子带能量谱熵比为特征
             高鸣声识别的准确率。在语声信号处理领域,语声                            量,结合鸟鸣声特点实现鸣声信号端点检测,在低信
             端点检测有两类方法:特征量 -门限法和模型 -分类                         噪比环境下算法端点检测有较好的鲁棒性,算法流
             器法  [19−20] ,前者计算量小,实时性高。对于鸟类鸣                    程如图3所示。




                                                              ߕ               ү     ద
                                       Პ                      ࣜ  ᑟ    Ლ       গ     ஍
                                       ܦ         ܳ    ᮕ       ᑟ  ᧚    Პ       ᒭ     Პ
                                       Ԕ     ஝   ᫼    ҫ       ᧚  ഐ    ܦ       ᤠ     ܦ
                                       ݽ     ૶   Ћ    ᧘       Ѭ  ဋ    ᑟ       ऄ     ඀
                                       ஝     ᮕ   ฉ    η       ࣋  Ѭ    ᧚       ԥ     ᒭ
                                       ૶     ܫ   ౌ    Ղ       ྲ  ࣋    ៨       ᫃     ү
                                       ᧔     ေ   ॎ    ᛪ       ढ़  ࠛ    ྅       ᬍ     ೝ
                                       ᬷ         ੇ    Ϫ       ೝ  ए    උ       ೝ     ฾
                                                              ฾       ϙ       ฾     Ѭ
                                                                                    ඀

                                                图 3  鸣声信号检测处理流程图
                                          Fig. 3 Birdsong signal detection and process
                 在确保鸟鸣声信号不失真的情况下,经过阵元                          2.2  动态双门限端点判决
             波束形成、预加重信号补偿等预处理后,选取鸟鸣                                野外环境下的噪声具有非平稳特性,当含噪鸣
             声信号 X(t) 为处理片段,对信号 X(t) 进行汉宁窗                     声信号的能量可以衰减到噪声能量级别时                    [25] ,含噪
             加窗分帧后,数据帧长度为 L 毫秒,做 N 点傅里叶
                                                               鸣声信号的能量谱熵比快速收敛,可以通过估计含
             变换,帧重叠 N/2点,预加重补偿后,对每一帧鸣声
                                                               噪鸣声信号局部最小值的方法,自适应估计噪声的
             信号进行短时傅里叶变换,得到每帧信号的能量谱,
                                                               门限值,提高算法鲁棒性           [26] 。
             其中第k 条谱线频率分量f k 的能量谱为|X i (k)| 。
                                                       2
                                                                   在低信噪比情况下,为减小误判提高检测准确
                 将一帧分成若干子带并求子带谱熵,假设每条
                                                               率,对含噪声的鸣声信号能量谱熵比进行多次中值
             子带有 n 条谱线,共有 M 个子带,第 i 帧中的第 m
                                                               滤波平滑处理后提取鸣声端点位置,将子带能量谱
             条子带能量E(m, i)为
                                                               熵比最大值 F max (m, i) 与均值 F 做差得到 D 作为
                              (m−1)∗n+(n−1)
                                   ∑              2            门限选取的基准阈值,采用双门限阈值进行有效鸣
                    E(m, i) =              |X i (k) | ,
                                                               声段判决,其双门限阈值可表示为T High = αD + F,
                                k=(m−1)∗n
                             1 6 m 6 M.                 (3)    T Low = βD + F,其中α、β 是动态调节系数。
                                                                   检测每段鸣声信号中能量较高的子带,确定
                 子带能量概率分布密度 p b (m, i) 和子带谱熵可
                                                               有效鸣声的起止点。为了提高计算效率,减小有效
             分别表示为
                                                               鸟鸣声段数据误差,当子带能量谱熵比 F ( m, i) 位
                               E b (m, i)
                    p b (m, i) =        ,               (4)
                              M                                于 T Low 时,则进入鸟鸣声段开始点,当超过高门
                              ∑
                                 E b (k, i)                    限再次回落至低门限时,则判定为有效鸣声段的
                              k=1
                                                               结束点。
                              M
                              ∑
                    H b (i) = −  p b (m, i) log p b (m, i).  (5)   在实际监测过程中,对采集到的鸣声数据进行
                             m=1                               自动分段,只传输有效鸣声段,若没有检测到活动
                 利用能量和子带谱熵构成子带能量谱熵比,为
                                                               鸣声段,则剔除冗余的无声数据段,数据不上传。为
             提高鸟鸣声信号和环境噪声检测能力,更突出噪声
                                                               获得完整的鸣声段,便于云平台做进一步数据处理,
             段与鸟鸣声段,本文设置 α 为常数 2,子带能量谱熵
                                                               通常将检测得到的鸣声数据段长度向前后各延伸
             比可表示为
                     v                                         15% 作为完整的鸣声段上传,如果两段鸣声之间的
                     u      (       N        )
                     t  1
                     u            1  ∑                       静音长度小于各自延伸长度的和,则认为这是连续
                                         2

                F i =     lg 1 +       x (m)  + 1.    (6)
                                         i
                       H i       α                           的鸣声段上传。
                          b         m=1
   57   58   59   60   61   62   63   64   65   66   67