Page 62 - 《应用声学》2022年第3期
P. 62
384 2022 年 5 月
础 [18] 。鸣声端点检测通过从含有背景噪声的鸟鸣 声的实验研究表明,大多数鸟鸣声频谱存在明显的
声信号中确定鸣声起止点,准确的端点检测能够提 子带峰值 [21−24] ,本文采用子带能量谱熵比为特征
高鸣声识别的准确率。在语声信号处理领域,语声 量,结合鸟鸣声特点实现鸣声信号端点检测,在低信
端点检测有两类方法:特征量 -门限法和模型 -分类 噪比环境下算法端点检测有较好的鲁棒性,算法流
器法 [19−20] ,前者计算量小,实时性高。对于鸟类鸣 程如图3所示。
ߕ ү ద
Პ ࣜ ᑟ Ლ গ
ܦ ܳ ᮕ ᑟ ᧚ Პ ᒭ Პ
Ԕ ҫ ᧚ ഐ ܦ ᤠ ܦ
ݽ Ћ ᧘ Ѭ ဋ ᑟ ऄ
ᮕ ฉ η ࣋ Ѭ ᧚ ԥ ᒭ
ܫ ౌ Ղ ྲ ࣋ ៨ ᫃ ү
᧔ ေ ॎ ᛪ ढ़ ࠛ ྅ ᬍ ೝ
ᬷ ੇ Ϫ ೝ ए උ ೝ
ϙ Ѭ
图 3 鸣声信号检测处理流程图
Fig. 3 Birdsong signal detection and process
在确保鸟鸣声信号不失真的情况下,经过阵元 2.2 动态双门限端点判决
波束形成、预加重信号补偿等预处理后,选取鸟鸣 野外环境下的噪声具有非平稳特性,当含噪鸣
声信号 X(t) 为处理片段,对信号 X(t) 进行汉宁窗 声信号的能量可以衰减到噪声能量级别时 [25] ,含噪
加窗分帧后,数据帧长度为 L 毫秒,做 N 点傅里叶
鸣声信号的能量谱熵比快速收敛,可以通过估计含
变换,帧重叠 N/2点,预加重补偿后,对每一帧鸣声
噪鸣声信号局部最小值的方法,自适应估计噪声的
信号进行短时傅里叶变换,得到每帧信号的能量谱,
门限值,提高算法鲁棒性 [26] 。
其中第k 条谱线频率分量f k 的能量谱为|X i (k)| 。
2
在低信噪比情况下,为减小误判提高检测准确
将一帧分成若干子带并求子带谱熵,假设每条
率,对含噪声的鸣声信号能量谱熵比进行多次中值
子带有 n 条谱线,共有 M 个子带,第 i 帧中的第 m
滤波平滑处理后提取鸣声端点位置,将子带能量谱
条子带能量E(m, i)为
熵比最大值 F max (m, i) 与均值 F 做差得到 D 作为
(m−1)∗n+(n−1)
∑ 2 门限选取的基准阈值,采用双门限阈值进行有效鸣
E(m, i) = |X i (k) | ,
声段判决,其双门限阈值可表示为T High = αD + F,
k=(m−1)∗n
1 6 m 6 M. (3) T Low = βD + F,其中α、β 是动态调节系数。
检测每段鸣声信号中能量较高的子带,确定
子带能量概率分布密度 p b (m, i) 和子带谱熵可
有效鸣声的起止点。为了提高计算效率,减小有效
分别表示为
鸟鸣声段数据误差,当子带能量谱熵比 F ( m, i) 位
E b (m, i)
p b (m, i) = , (4)
M 于 T Low 时,则进入鸟鸣声段开始点,当超过高门
∑
E b (k, i) 限再次回落至低门限时,则判定为有效鸣声段的
k=1
结束点。
M
∑
H b (i) = − p b (m, i) log p b (m, i). (5) 在实际监测过程中,对采集到的鸣声数据进行
m=1 自动分段,只传输有效鸣声段,若没有检测到活动
利用能量和子带谱熵构成子带能量谱熵比,为
鸣声段,则剔除冗余的无声数据段,数据不上传。为
提高鸟鸣声信号和环境噪声检测能力,更突出噪声
获得完整的鸣声段,便于云平台做进一步数据处理,
段与鸟鸣声段,本文设置 α 为常数 2,子带能量谱熵
通常将检测得到的鸣声数据段长度向前后各延伸
比可表示为
v 15% 作为完整的鸣声段上传,如果两段鸣声之间的
u ( N )
t 1
u 1 ∑ 静音长度小于各自延伸长度的和,则认为这是连续
2
F i = lg 1 + x (m) + 1. (6)
i
H i α 的鸣声段上传。
b m=1