Page 128 - 201805

P. 128

710 2018 年 9 月

法是在听者封闭耳道或鼓膜处测量 HpTF，然后双垂面方向的声源定位有着重要作用。而耳廓等引
耳录制信号与HpTF进行解卷积(Deconvolved)。这起的高频谱因素极具个性化特征，因此在 HRIR 与
种直接均衡方式称为非耦合均衡模式 (Non decou- HpTF的测量、合成、均衡以及处理每一环节的误差
pled mode of equalization) [45] 。HpTF 由于包含耳都可能引起耳机重放的声像畸变 [2] 。不同的声像实
机到听者之间的传输响应，因此也具有个性化特征验研究表明个性化的HRIR 双耳声像合成和HpTF
同时与测量位置密切相关。研究表明个性化 HpTF 均衡，一定程度上可减少耳机重放声像畸变 [51] 。实
均衡和个性化 HRIR 同样重要，在低频 HpTF 变化际中针对非个性化的 HRIR，也有研究者通过修正
较小，但是在高频其偏差可达10 dB，实际中针对某 HRIR频谱一定程度提高性能。Zhang等 [52] 夸大前
一个具体测量位置的 HpTF 均衡可能带来比不均后方位 HRIR 的幅度谱差异，使原有频谱峰值基本
衡更差的效果 [46] 。实际中对多次测量的 HpTF 取保持不变，但谷值部分加深。类似的 Park 等 [53] 利
平均进行均衡，一定程度上可减少均衡效果对位置用不同的权重函数实现。Lee等 [54] 则利用不同权重
的依赖性。为减少 HpTF均衡效果对听者的高度依函数，提升前半球方向的HRIR 增益，衰减后半球方
赖性，Sunder 等 [47] 提出一种 Type-2 均衡算法，其向的 HRIR 增益，来减少前后混乱。Tan 等 [55] 则是
利用前方投射耳机 (Frontal projection headphone) 利用不同频带内衰减不同的增益来减少前后混淆。
结构模型，解除耳机与听者双耳耦合关系，只均衡 4.3 头内定位
发射端 (Eimitter) 引起的畸变，保留个性化的耳廓
耳机重放时存在的另一个问题是重放时虚拟
信息。第二种常用的均衡算法是解耦和均衡算法
声像主要集中听者头内，这种不自然的听觉现
(Decoupled equalization technique)，其采用一个参
象统称为头内定位 (Inside-the-head Localization,
考声场 (Reference sound ﬁeld, REF)(自由场、扩散 [56]
IHL) 。研究表明，头内定位主要是由声重放在双
场或者一个参考响应)进行均衡 [45] 。实际中如果录
耳处产生的错误空间信息导致，如非个性化的人工
制环境的参考声场已知，其相对非解耦和均衡方法
头捡拾信号或者非个性化的HRIR合成以及耳机传
效果更加自然。输响应不平直等导致的双耳声压畸变。因此个性化
针对均衡滤波器具体设计，早期有 FIR、IIR
的 HRIR 和 HpTF 均衡处理可一定程度上提高头
滤波器均衡设计。由于人耳对低频段声音更为敏外声像效果 [57] 。在自然环境中，除了直达声外，增
感，Härmä 等 [48] 将线性频率转换成弯折 (Warp)频
加环境反射声对产生头外声像也很重要，相应地在
率域进行均衡滤波器设计，优化低频段性能。进一双耳合成中增加室内空间信息减少头中定位。Xia
步地，Karjalainen 等 [49] 又提出 Kautz 滤波器实现
等 [58] 利用混合混响建模构建 BRIR 用于双耳重放，
更为复杂的频率分辨率映射。但这些滤波器设计都主观实验证实其可提高声像外在化和真实感。
是基于数学意义上误差最小，并不一定听觉最优。
Fang 等 [50] 引入考虑人耳听觉特性的相关加权函 5 双耳音频信号的扬声器重放

数，对 LMS 算法求取均衡滤波器系数的步长加权，
相对耳机重放，双耳信号利用扬声器重放可很
在人耳比较敏感的低频段采用较小步长，相反在人
大程度上避免头内定位问题，同时针对一些特定场
耳不太敏感的高频段采用较大步长，合理利用 LMS
景如多人会议通话及家庭影院等，运用扬声器更适
算法收敛速度与稳态误差之间的矛盾，获得低频段
宜方便。但扬声器与听者双耳之间存在的串声问
均衡误差相对高频段较小的均衡效果。
题极大地干扰听者对空间三维声像的感知，需要增
4.2 方向畸变加相应的串声消除系统对双耳信号预处理。串声
耳机重放双耳信号也常常会出现声像方向的消除问题的提出可追溯到 1961 年，CBS 实验室的
畸变，如前后镜像方向的声像混乱(Front-back con- Bauer [59] 在研究录制的立体声双耳信号利用扬声
fusion) 和仰角畸变 (Elevation error) 等。在各种声器重放时，分析听者双耳接受到信号丢失空间信息，
源方向定位因素中，耳廓等带来的高频谱因素和头因为存在扬声器到听者双耳之间的串声。随后1962
动引起的动态定位因素对区分前后镜像方向和中年Atal等 [60] 在其专利中具体实现了相应的串声消

123 124 125 126 127 128 129 130 131 132 133