Page 127 - 201805
P. 127

第 37 卷 第 5 期              李军锋等: 基于听觉感知特性的双耳音频处理技术                                           709


             要一定测量且阶数相对HRIR更长,与特定房间、听                          矩阵保证输入输出信号能量相等。反馈矩阵调整每
             者以及听者和声源的绝对位置相关,更为复杂。将                            一个反馈路径上的延时,可以看成 Schroeder 混响
             BRIR看成HRIR 与房间冲击响(Room impulse re-                算法中级联梳状滤波器的推广。通过调整反馈矩阵
             sponse, RIR) 的卷积,实际中一定程度上可在听觉                     中非零反馈系数和不等延时长度,可产生更高的混
             上模拟等效的空间环境声效果。因此 BRIR 的模拟                         响密度。Jot 等提出了一系列 FDN 算法设计思想,
             转换成房间冲击响应RIR的模拟。完整的RIR主要                          可以较为独立控制不同频带内的混响时间,模拟出
             包含直达声、早期反射和后期混响                [35] ;主要模拟算        高质量的人工混响效果。实际中反馈延时网络的选
             法可以分为三大类:基于物理特性 (Physics-based                    取至关重要,相关实验和研究表明酉矩阵,如三角矩
             modeling)的建模、基于感知特性(Perception-based              阵、Householder 矩阵   [39] 、Hadamard 矩阵  [40] ,可以
             modeling) 的建模和两者混合的建模方法。                          产生较好的混响模拟效果。
                 基于物理特性的 RIR 建模主要模拟声源在空                            基于物理特性混响模拟不利于实时系统运用,
             气中的传播和来自四周边界引起反射的物理机制。                            而基于感知特性混响模拟提高了计算速度,但不
             从基本原理划分,包括基于几何声学的建模和基于                            能很好反映待模拟环境声学特性。综合考虑两种
             波动声学的建模两大类           [2] 。基于几何声学的房间建              混响模拟的优点,实际中也常采用结合物理特性
             模思路是构造声场空间的计算表示然后由此导出                             和感知特性的混合混响模拟方法。Rindel                  [41]  利用
             声音的传播路径。基于波动声学的房间响应是建                             ISM 建模早期反射而后期混响采用 RTM 实现。此
             模构造声源的传输声线路径,其遵循相应的波动方                            外,Murphy等    [42]  提出从实际测量RIR中直接截取
             程,然后在虚拟空间中追踪其路径,最后利用数学                            一较短FIR 响应产生早期混响,后期混响利用FDN
             模型逼近声源模式、空气吸收、边界反射、衍射等                            模拟。但由不同方法模拟的早期反射和后期混响之
             特性。相应的主要方法有声线跟踪法 (Ray-tracing                     间的平滑过渡是混合混响模拟算法需要解决的一
             method, RTM)、镜像源法 (Image source method,           个重要问题。为解决这个问题,徐华兴等                   [43]  和 Xia
             ISM)和波束跟踪法(Beam tracing method, BTM)。             等 [44]  提出一种基于物理特性和感知特性的混合混
                 基于感知特性建模中早期反射可看成是衰减                           响模拟方法,利用 ISM 建模产生的早期 RIR卷积得
             和延时的直达声,利用具有稀疏间隔分布的 FIR                           到早期反射,而后期混响利用 FDN 实现。进一步又
             滤波器表征,其延时和衰减参数通常基于经验确                             利用一参数化预测模型估计 ISM 建模产生的早期
             定。后期混响建模早期常用梳状滤波器建模,其                             反射的能量衰减曲面 (Energy decay relief, EDR),

             能产生一个时移和衰减的直达声,缺点是会出现                             相应地实时自动计算 FDN 参数。所提出算法不仅
             额外的叠加音调感觉且由于频率响应不为常数会                             保证了早期反射到后期混响在时 - 频域的平滑过
             产生频谱染色。而后提出利用全通滤波器的改进                             渡,且一定程度上模拟的后期混响能反映待模拟环
             算法,频率响应更加平滑,同时其延时与频率相                             境的声学特性。
             关,一定程度上减少主观听觉上的频谱染色问题。
             Schroeder [36]  结合梳状滤波器和全通滤波器提出经                  4 双耳音频信号的耳机重放
             典 Schroeder 混响算法,该算法成为现代混响算法
                                                                   录制或合成的双耳信号利用耳机重放时由于
             的基石。Moorer    [37]  为了模拟空气的高频衰减特性,
                                                               耳机不平直的传递函数会破坏双耳感知信息,因此
             对梳状滤波器引入一阶低通滤波器,通过精细调整
                                                               需要相应的均衡。此外由于非个性化HRTF影响以
             延时和衰减参数,相对 Schroeder 混响算法带来更
                                                               及缺乏动态定位因素等也会引起头内定位、前后混
             自然平滑的混响性能。对 Schroeder 混响算法进行
                                                               淆等问题。
             更多关键改进,由 Gerzon        [38]  提出,然后有多位研
             究者改进 (特别是 Jot 等       [39] ) 的反馈延时网络算法            4.1  耳机均衡
             (Feedback delay network, FDN) 是如今较为广泛                 通常耳机传递函数包括耳机换能器 (Trans-
             使用的后期混响模拟算法。FDN 算法包含一个多                           ducer) 响应和耳机与听者双耳耦合 (Coupling) 响
             通道延时回路和一个个反馈延时网络,其系统为酉                            应。由于HpTF幅频特性不平直,需要均衡。基本做
   122   123   124   125   126   127   128   129   130   131   132