Page 128 - 201805
P. 128

710                                                                                  2018 年 9 月


             法是在听者封闭耳道或鼓膜处测量 HpTF,然后双                          垂面方向的声源定位有着重要作用。而耳廓等引
             耳录制信号与HpTF进行解卷积(Deconvolved)。这                    起的高频谱因素极具个性化特征,因此在 HRIR 与
             种直接均衡方式称为非耦合均衡模式 (Non decou-                      HpTF的测量、合成、均衡以及处理每一环节的误差
             pled mode of equalization) [45] 。HpTF 由于包含耳       都可能引起耳机重放的声像畸变                [2] 。不同的声像实
             机到听者之间的传输响应,因此也具有个性化特征                            验研究表明个性化的HRIR 双耳声像合成和HpTF
             同时与测量位置密切相关。研究表明个性化 HpTF                          均衡,一定程度上可减少耳机重放声像畸变                    [51] 。实
             均衡和个性化 HRIR 同样重要,在低频 HpTF 变化                      际中针对非个性化的 HRIR,也有研究者通过修正
             较小,但是在高频其偏差可达10 dB,实际中针对某                         HRIR频谱一定程度提高性能。Zhang等                [52]  夸大前
             一个具体测量位置的 HpTF 均衡可能带来比不均                          后方位 HRIR 的幅度谱差异,使原有频谱峰值基本
             衡更差的效果       [46] 。实际中对多次测量的 HpTF 取               保持不变,但谷值部分加深。类似的 Park 等                  [53]  利
             平均进行均衡,一定程度上可减少均衡效果对位置                            用不同的权重函数实现。Lee等             [54]  则利用不同权重
             的依赖性。为减少 HpTF均衡效果对听者的高度依                          函数,提升前半球方向的HRIR 增益,衰减后半球方
             赖性,Sunder 等   [47]  提出一种 Type-2 均衡算法,其            向的 HRIR 增益,来减少前后混乱。Tan 等               [55]  则是
             利用前方投射耳机 (Frontal projection headphone)           利用不同频带内衰减不同的增益来减少前后混淆。
             结构模型,解除耳机与听者双耳耦合关系,只均衡                            4.3  头内定位
             发射端 (Eimitter) 引起的畸变,保留个性化的耳廓
                                                                   耳机重放时存在的另一个问题是重放时虚拟
             信息。第二种常用的均衡算法是解耦和均衡算法
                                                               声像主要集中听者头内,这种不自然的听觉现
             (Decoupled equalization technique),其采用一个参
                                                               象统称为头内定位 (Inside-the-head Localization,
             考声场 (Reference sound field, REF)(自由场、扩散                [56]
                                                               IHL)   。研究表明,头内定位主要是由声重放在双
             场或者一个参考响应)进行均衡              [45] 。实际中如果录
                                                               耳处产生的错误空间信息导致,如非个性化的人工
             制环境的参考声场已知,其相对非解耦和均衡方法
                                                               头捡拾信号或者非个性化的HRIR合成以及耳机传
             效果更加自然。                                           输响应不平直等导致的双耳声压畸变。因此个性化
                 针对均衡滤波器具体设计,早期有 FIR、IIR
                                                               的 HRIR 和 HpTF 均衡处理可一定程度上提高头
             滤波器均衡设计。由于人耳对低频段声音更为敏                             外声像效果      [57] 。在自然环境中,除了直达声外,增
             感,Härmä 等   [48]  将线性频率转换成弯折 (Warp)频
                                                               加环境反射声对产生头外声像也很重要,相应地在
             率域进行均衡滤波器设计,优化低频段性能。进一                            双耳合成中增加室内空间信息减少头中定位。Xia
             步地,Karjalainen 等   [49]  又提出 Kautz 滤波器实现
                                                               等 [58]  利用混合混响建模构建 BRIR 用于双耳重放,
             更为复杂的频率分辨率映射。但这些滤波器设计都                            主观实验证实其可提高声像外在化和真实感。
             是基于数学意义上误差最小,并不一定听觉最优。
             Fang 等  [50]  引入考虑人耳听觉特性的相关加权函                    5 双耳音频信号的扬声器重放

             数,对 LMS 算法求取均衡滤波器系数的步长加权,
                                                                   相对耳机重放,双耳信号利用扬声器重放可很
             在人耳比较敏感的低频段采用较小步长,相反在人
                                                               大程度上避免头内定位问题,同时针对一些特定场
             耳不太敏感的高频段采用较大步长,合理利用 LMS
                                                               景如多人会议通话及家庭影院等,运用扬声器更适
             算法收敛速度与稳态误差之间的矛盾,获得低频段
                                                               宜方便。但扬声器与听者双耳之间存在的串声问
             均衡误差相对高频段较小的均衡效果。
                                                               题极大地干扰听者对空间三维声像的感知,需要增
             4.2 方向畸变                                          加相应的串声消除系统对双耳信号预处理。串声
                 耳机重放双耳信号也常常会出现声像方向的                           消除问题的提出可追溯到 1961 年,CBS 实验室的
             畸变,如前后镜像方向的声像混乱(Front-back con-                   Bauer [59]  在研究录制的立体声双耳信号利用扬声
             fusion) 和仰角畸变 (Elevation error) 等。在各种声            器重放时,分析听者双耳接受到信号丢失空间信息,
             源方向定位因素中,耳廓等带来的高频谱因素和头                            因为存在扬声器到听者双耳之间的串声。随后1962
             动引起的动态定位因素对区分前后镜像方向和中                             年Atal等   [60]  在其专利中具体实现了相应的串声消
   123   124   125   126   127   128   129   130   131   132   133