Page 127 - 201805
P. 127
第 37 卷 第 5 期 李军锋等: 基于听觉感知特性的双耳音频处理技术 709
要一定测量且阶数相对HRIR更长,与特定房间、听 矩阵保证输入输出信号能量相等。反馈矩阵调整每
者以及听者和声源的绝对位置相关,更为复杂。将 一个反馈路径上的延时,可以看成 Schroeder 混响
BRIR看成HRIR 与房间冲击响(Room impulse re- 算法中级联梳状滤波器的推广。通过调整反馈矩阵
sponse, RIR) 的卷积,实际中一定程度上可在听觉 中非零反馈系数和不等延时长度,可产生更高的混
上模拟等效的空间环境声效果。因此 BRIR 的模拟 响密度。Jot 等提出了一系列 FDN 算法设计思想,
转换成房间冲击响应RIR的模拟。完整的RIR主要 可以较为独立控制不同频带内的混响时间,模拟出
包含直达声、早期反射和后期混响 [35] ;主要模拟算 高质量的人工混响效果。实际中反馈延时网络的选
法可以分为三大类:基于物理特性 (Physics-based 取至关重要,相关实验和研究表明酉矩阵,如三角矩
modeling)的建模、基于感知特性(Perception-based 阵、Householder 矩阵 [39] 、Hadamard 矩阵 [40] ,可以
modeling) 的建模和两者混合的建模方法。 产生较好的混响模拟效果。
基于物理特性的 RIR 建模主要模拟声源在空 基于物理特性混响模拟不利于实时系统运用,
气中的传播和来自四周边界引起反射的物理机制。 而基于感知特性混响模拟提高了计算速度,但不
从基本原理划分,包括基于几何声学的建模和基于 能很好反映待模拟环境声学特性。综合考虑两种
波动声学的建模两大类 [2] 。基于几何声学的房间建 混响模拟的优点,实际中也常采用结合物理特性
模思路是构造声场空间的计算表示然后由此导出 和感知特性的混合混响模拟方法。Rindel [41] 利用
声音的传播路径。基于波动声学的房间响应是建 ISM 建模早期反射而后期混响采用 RTM 实现。此
模构造声源的传输声线路径,其遵循相应的波动方 外,Murphy等 [42] 提出从实际测量RIR中直接截取
程,然后在虚拟空间中追踪其路径,最后利用数学 一较短FIR 响应产生早期混响,后期混响利用FDN
模型逼近声源模式、空气吸收、边界反射、衍射等 模拟。但由不同方法模拟的早期反射和后期混响之
特性。相应的主要方法有声线跟踪法 (Ray-tracing 间的平滑过渡是混合混响模拟算法需要解决的一
method, RTM)、镜像源法 (Image source method, 个重要问题。为解决这个问题,徐华兴等 [43] 和 Xia
ISM)和波束跟踪法(Beam tracing method, BTM)。 等 [44] 提出一种基于物理特性和感知特性的混合混
基于感知特性建模中早期反射可看成是衰减 响模拟方法,利用 ISM 建模产生的早期 RIR卷积得
和延时的直达声,利用具有稀疏间隔分布的 FIR 到早期反射,而后期混响利用 FDN 实现。进一步又
滤波器表征,其延时和衰减参数通常基于经验确 利用一参数化预测模型估计 ISM 建模产生的早期
定。后期混响建模早期常用梳状滤波器建模,其 反射的能量衰减曲面 (Energy decay relief, EDR),
能产生一个时移和衰减的直达声,缺点是会出现 相应地实时自动计算 FDN 参数。所提出算法不仅
额外的叠加音调感觉且由于频率响应不为常数会 保证了早期反射到后期混响在时 - 频域的平滑过
产生频谱染色。而后提出利用全通滤波器的改进 渡,且一定程度上模拟的后期混响能反映待模拟环
算法,频率响应更加平滑,同时其延时与频率相 境的声学特性。
关,一定程度上减少主观听觉上的频谱染色问题。
Schroeder [36] 结合梳状滤波器和全通滤波器提出经 4 双耳音频信号的耳机重放
典 Schroeder 混响算法,该算法成为现代混响算法
录制或合成的双耳信号利用耳机重放时由于
的基石。Moorer [37] 为了模拟空气的高频衰减特性,
耳机不平直的传递函数会破坏双耳感知信息,因此
对梳状滤波器引入一阶低通滤波器,通过精细调整
需要相应的均衡。此外由于非个性化HRTF影响以
延时和衰减参数,相对 Schroeder 混响算法带来更
及缺乏动态定位因素等也会引起头内定位、前后混
自然平滑的混响性能。对 Schroeder 混响算法进行
淆等问题。
更多关键改进,由 Gerzon [38] 提出,然后有多位研
究者改进 (特别是 Jot 等 [39] ) 的反馈延时网络算法 4.1 耳机均衡
(Feedback delay network, FDN) 是如今较为广泛 通常耳机传递函数包括耳机换能器 (Trans-
使用的后期混响模拟算法。FDN 算法包含一个多 ducer) 响应和耳机与听者双耳耦合 (Coupling) 响
通道延时回路和一个个反馈延时网络,其系统为酉 应。由于HpTF幅频特性不平直,需要均衡。基本做