Page 128 - 201805
P. 128
710 2018 年 9 月
法是在听者封闭耳道或鼓膜处测量 HpTF,然后双 垂面方向的声源定位有着重要作用。而耳廓等引
耳录制信号与HpTF进行解卷积(Deconvolved)。这 起的高频谱因素极具个性化特征,因此在 HRIR 与
种直接均衡方式称为非耦合均衡模式 (Non decou- HpTF的测量、合成、均衡以及处理每一环节的误差
pled mode of equalization) [45] 。HpTF 由于包含耳 都可能引起耳机重放的声像畸变 [2] 。不同的声像实
机到听者之间的传输响应,因此也具有个性化特征 验研究表明个性化的HRIR 双耳声像合成和HpTF
同时与测量位置密切相关。研究表明个性化 HpTF 均衡,一定程度上可减少耳机重放声像畸变 [51] 。实
均衡和个性化 HRIR 同样重要,在低频 HpTF 变化 际中针对非个性化的 HRIR,也有研究者通过修正
较小,但是在高频其偏差可达10 dB,实际中针对某 HRIR频谱一定程度提高性能。Zhang等 [52] 夸大前
一个具体测量位置的 HpTF 均衡可能带来比不均 后方位 HRIR 的幅度谱差异,使原有频谱峰值基本
衡更差的效果 [46] 。实际中对多次测量的 HpTF 取 保持不变,但谷值部分加深。类似的 Park 等 [53] 利
平均进行均衡,一定程度上可减少均衡效果对位置 用不同的权重函数实现。Lee等 [54] 则利用不同权重
的依赖性。为减少 HpTF均衡效果对听者的高度依 函数,提升前半球方向的HRIR 增益,衰减后半球方
赖性,Sunder 等 [47] 提出一种 Type-2 均衡算法,其 向的 HRIR 增益,来减少前后混乱。Tan 等 [55] 则是
利用前方投射耳机 (Frontal projection headphone) 利用不同频带内衰减不同的增益来减少前后混淆。
结构模型,解除耳机与听者双耳耦合关系,只均衡 4.3 头内定位
发射端 (Eimitter) 引起的畸变,保留个性化的耳廓
耳机重放时存在的另一个问题是重放时虚拟
信息。第二种常用的均衡算法是解耦和均衡算法
声像主要集中听者头内,这种不自然的听觉现
(Decoupled equalization technique),其采用一个参
象统称为头内定位 (Inside-the-head Localization,
考声场 (Reference sound field, REF)(自由场、扩散 [56]
IHL) 。研究表明,头内定位主要是由声重放在双
场或者一个参考响应)进行均衡 [45] 。实际中如果录
耳处产生的错误空间信息导致,如非个性化的人工
制环境的参考声场已知,其相对非解耦和均衡方法
头捡拾信号或者非个性化的HRIR合成以及耳机传
效果更加自然。 输响应不平直等导致的双耳声压畸变。因此个性化
针对均衡滤波器具体设计,早期有 FIR、IIR
的 HRIR 和 HpTF 均衡处理可一定程度上提高头
滤波器均衡设计。由于人耳对低频段声音更为敏 外声像效果 [57] 。在自然环境中,除了直达声外,增
感,Härmä 等 [48] 将线性频率转换成弯折 (Warp)频
加环境反射声对产生头外声像也很重要,相应地在
率域进行均衡滤波器设计,优化低频段性能。进一 双耳合成中增加室内空间信息减少头中定位。Xia
步地,Karjalainen 等 [49] 又提出 Kautz 滤波器实现
等 [58] 利用混合混响建模构建 BRIR 用于双耳重放,
更为复杂的频率分辨率映射。但这些滤波器设计都 主观实验证实其可提高声像外在化和真实感。
是基于数学意义上误差最小,并不一定听觉最优。
Fang 等 [50] 引入考虑人耳听觉特性的相关加权函 5 双耳音频信号的扬声器重放
数,对 LMS 算法求取均衡滤波器系数的步长加权,
相对耳机重放,双耳信号利用扬声器重放可很
在人耳比较敏感的低频段采用较小步长,相反在人
大程度上避免头内定位问题,同时针对一些特定场
耳不太敏感的高频段采用较大步长,合理利用 LMS
景如多人会议通话及家庭影院等,运用扬声器更适
算法收敛速度与稳态误差之间的矛盾,获得低频段
宜方便。但扬声器与听者双耳之间存在的串声问
均衡误差相对高频段较小的均衡效果。
题极大地干扰听者对空间三维声像的感知,需要增
4.2 方向畸变 加相应的串声消除系统对双耳信号预处理。串声
耳机重放双耳信号也常常会出现声像方向的 消除问题的提出可追溯到 1961 年,CBS 实验室的
畸变,如前后镜像方向的声像混乱(Front-back con- Bauer [59] 在研究录制的立体声双耳信号利用扬声
fusion) 和仰角畸变 (Elevation error) 等。在各种声 器重放时,分析听者双耳接受到信号丢失空间信息,
源方向定位因素中,耳廓等带来的高频谱因素和头 因为存在扬声器到听者双耳之间的串声。随后1962
动引起的动态定位因素对区分前后镜像方向和中 年Atal等 [60] 在其专利中具体实现了相应的串声消