Page 127 - 201805

P. 127

第 37 卷第 5 期李军锋等：基于听觉感知特性的双耳音频处理技术 709

要一定测量且阶数相对HRIR更长，与特定房间、听矩阵保证输入输出信号能量相等。反馈矩阵调整每
者以及听者和声源的绝对位置相关，更为复杂。将一个反馈路径上的延时，可以看成 Schroeder 混响
BRIR看成HRIR 与房间冲击响(Room impulse re- 算法中级联梳状滤波器的推广。通过调整反馈矩阵
sponse, RIR) 的卷积，实际中一定程度上可在听觉中非零反馈系数和不等延时长度，可产生更高的混
上模拟等效的空间环境声效果。因此 BRIR 的模拟响密度。Jot 等提出了一系列 FDN 算法设计思想，
转换成房间冲击响应RIR的模拟。完整的RIR主要可以较为独立控制不同频带内的混响时间，模拟出
包含直达声、早期反射和后期混响 [35] ；主要模拟算高质量的人工混响效果。实际中反馈延时网络的选
法可以分为三大类：基于物理特性 (Physics-based 取至关重要，相关实验和研究表明酉矩阵，如三角矩
modeling)的建模、基于感知特性(Perception-based 阵、Householder 矩阵 [39] 、Hadamard 矩阵 [40] ，可以
modeling) 的建模和两者混合的建模方法。产生较好的混响模拟效果。
基于物理特性的 RIR 建模主要模拟声源在空基于物理特性混响模拟不利于实时系统运用，
气中的传播和来自四周边界引起反射的物理机制。而基于感知特性混响模拟提高了计算速度，但不
从基本原理划分，包括基于几何声学的建模和基于能很好反映待模拟环境声学特性。综合考虑两种
波动声学的建模两大类 [2] 。基于几何声学的房间建混响模拟的优点，实际中也常采用结合物理特性
模思路是构造声场空间的计算表示然后由此导出和感知特性的混合混响模拟方法。Rindel [41] 利用
声音的传播路径。基于波动声学的房间响应是建 ISM 建模早期反射而后期混响采用 RTM 实现。此
模构造声源的传输声线路径，其遵循相应的波动方外，Murphy等 [42] 提出从实际测量RIR中直接截取
程，然后在虚拟空间中追踪其路径，最后利用数学一较短FIR 响应产生早期混响，后期混响利用FDN
模型逼近声源模式、空气吸收、边界反射、衍射等模拟。但由不同方法模拟的早期反射和后期混响之
特性。相应的主要方法有声线跟踪法 (Ray-tracing 间的平滑过渡是混合混响模拟算法需要解决的一
method, RTM)、镜像源法 (Image source method, 个重要问题。为解决这个问题，徐华兴等 [43] 和 Xia
ISM)和波束跟踪法(Beam tracing method, BTM)。等 [44] 提出一种基于物理特性和感知特性的混合混
基于感知特性建模中早期反射可看成是衰减响模拟方法，利用 ISM 建模产生的早期 RIR卷积得
和延时的直达声，利用具有稀疏间隔分布的 FIR 到早期反射，而后期混响利用 FDN 实现。进一步又
滤波器表征，其延时和衰减参数通常基于经验确利用一参数化预测模型估计 ISM 建模产生的早期
定。后期混响建模早期常用梳状滤波器建模，其反射的能量衰减曲面 (Energy decay relief, EDR)，

能产生一个时移和衰减的直达声，缺点是会出现相应地实时自动计算 FDN 参数。所提出算法不仅
额外的叠加音调感觉且由于频率响应不为常数会保证了早期反射到后期混响在时 - 频域的平滑过
产生频谱染色。而后提出利用全通滤波器的改进渡，且一定程度上模拟的后期混响能反映待模拟环
算法，频率响应更加平滑，同时其延时与频率相境的声学特性。
关，一定程度上减少主观听觉上的频谱染色问题。
Schroeder [36] 结合梳状滤波器和全通滤波器提出经 4 双耳音频信号的耳机重放
典 Schroeder 混响算法，该算法成为现代混响算法
录制或合成的双耳信号利用耳机重放时由于
的基石。Moorer [37] 为了模拟空气的高频衰减特性，
耳机不平直的传递函数会破坏双耳感知信息，因此
对梳状滤波器引入一阶低通滤波器，通过精细调整
需要相应的均衡。此外由于非个性化HRTF影响以
延时和衰减参数，相对 Schroeder 混响算法带来更
及缺乏动态定位因素等也会引起头内定位、前后混
自然平滑的混响性能。对 Schroeder 混响算法进行
淆等问题。
更多关键改进，由 Gerzon [38] 提出，然后有多位研
究者改进 (特别是 Jot 等 [39] ) 的反馈延时网络算法 4.1 耳机均衡
(Feedback delay network, FDN) 是如今较为广泛通常耳机传递函数包括耳机换能器 (Trans-
使用的后期混响模拟算法。FDN 算法包含一个多 ducer) 响应和耳机与听者双耳耦合 (Coupling) 响
通道延时回路和一个个反馈延时网络，其系统为酉应。由于HpTF幅频特性不平直，需要均衡。基本做

122 123 124 125 126 127 128 129 130 131 132