Page 9 - 《应用声学》2020年第2期
P. 9
第 39 卷 第 2 期 吴礼福等: 频域合成房间频率响应的人工混响方法 167
1.0 1.0
0.8
0.6
0.4
0.5
0.2
ࣨϙ 0 ࣨϙ
-0.2
0
-0.4
-0.6
-0.8
-1.0 -0.5
0 500 1000 1500 2000 2500 3000 0 500 1000 1500 2000 2500 3000
(a) ᄾࠄᫎࠄ (b) ISMข
1.0 1.0
0.8 0.8
0.6
0.6
0.4
0.4
0.2 0.2
ࣨϙ 0 ࣨϙ
-0.2 0
-0.2
-0.4
-0.6 -0.4
-0.8 -0.6
-1.0 -0.8
0 500 1000 1500 2000 2500 3000 0 500 1000 1500 2000 2500 3000
(c) FDNข (d) ARMAข
图 1 4 种方法获取的房间脉冲响应
Fig. 1 Room impulse response obtained by four different methods
图2给出了图1中4个RIR的能量衰减曲线,从 的结果接近,生成的 RIR 计算得到的混响时间与设
中可以看出 ARMA 法的能量衰减曲线与 ISM 的非 定值之间的误差也较小。
常接近,两者与真实房间能量衰减曲线的距离明显 除了从生成的 RIR 角度对比 3 种方法,本文还
小于 FDN。另一方面,采用施罗德反向积分法计算 采用人工混响处理后的语音信号来评价 3 种方法。
得到 ISM、FDN 和 ARMA 法生成的 RIR 的混响时 首先,从 TIMIT 数据库中 [1] 随机选取了 20 条语音
间分别为 0.39 s、0.44 s 和 0.40 s,这与图 2 的能量 作为纯净无混响的信号 (式(1)中的x(t)),再将纯净
衰减曲线体现的趋势一致,表明 FDN 方法生成的 无混响信号分别与真实房间、3 种方法生成的各 20
RIR 与真实房间的差异较大。ARMA 法和 ISM 法 条 RIR 做卷积得到混响信号 (每种方法 400 条)。采
用语音质量感知评价 [14] (Perceptual evaluation of
0
speech quality, PESQ) 对混响效果进行评价,将真
Real
-10 ISM 实房间的混响信号作为 PESQ 的参考基准信号,其
FDN
-20 ARMA 他3 种方法的混响信号分别与参考基准信号计算得
ᑟ᧚ᛰѓ/dB -30 到 PESQ 评分。图 3 为 3 种处理方法得到的混响信
号的 PESQ 平均得分及标准差,其中 ISM 平均得分
-40
为 2.77,标准差为 0.04;FDN 平均得分为 2.55,标准
-50
差为 0.02;ARMA 平均得分为 2.68,标准差为 0.02。
-60
图 3 表明 ARMA 法生成的混响信号比 FDN 法的更
0 0.05 0.10 0.15 0.20 0.25 0.30
ᫎ/s 接近真实房间的混响信号。
听者的主观感受是判断混响感的重要评价
图 2 4 种方法获取的房间脉冲响应的能量衰减曲线
Fig. 2 Energy decay curves of room impulse re- 标准,因此设计一组听音实验来判断 3 种方法中
sponses obtained by four different methods 最接近真实房间产生的混响信号。在 AISHELL-