Page 130 - 201805
P. 130
712 2018 年 9 月
spot) 则说明人头转动或移动时串消系统鲁棒性能。 等 [86] 又分析提出了扩展的三通道OSD系统。
将两者结合,为提高串消系统的总体鲁棒性能,以串 一般的串声消除均是考虑单一听者,理论上,扬
消系统条件数为基础或者实验中理论分析最佳听 声器双耳重放设计对应的理想串声消除系统,多个
音区域大小确定扬声器听者位置和数目寻找鲁棒 听者都能感受到三维音效,但实际应用仍较为困难,
的扬声器与听者布置,相应的研究主要分为两大类: 对应的研究还较少。早期,Kim等 [87] 利用自由场传
线性扬声器阵列分布和环形扬声器阵列分布。 输函数基于条件数鲁棒性分析,对多扬声器多听者
早期,Ward等 [79] 将扬声器到人耳的传输函数 串声消除系统 (主要是 4 扬声器 4 听者) 进行了初步
利用简单自由场模拟 (其后又用一个简化结构模型 的理论分析和研究。进一步地,Masiero 等 [88] 考虑
验证),定义一简单代价函数模拟人头前后左右移动 声波衍射将听者人头用钢球模拟 (Rigid sphere) 基
对串声消除性能的影响,得出在频率600 Hz 以上扬 于条件数理论分析了线性扬声器分布和圆形扬声
声器之间距离分布的鲁棒性与频率成反比。针对声 器分布的 4 扬声器 2 听者串消系统,得出实际中不
源的不同频率,不同扬声器应按不同间隔摆放,这可 同频率扬声器鲁棒性分布间隔不同且相差较大,实
以看成是线性扬声器阵列 (Linear loudspeaker ar- 现较为困难。
ray) 思想的雏形。在此基础上,Ward 等 [80] 又利用
传输矩阵的条件数,进一步来论证串声消除的鲁棒 6 听者头部运动跟踪
性,提出一个简化的针对频率范围 400 Hz∼5 kHz
的分频带线性三扬声器串声消除系统。Yang 等 [81] 实际自然的听觉环境,听者头部会移动或者转
动,其会改变声源到听者的传输路径和听者生理结
对三扬声器整体重放的传输矩阵利用条件数进行
鲁棒性分析,论证得出三扬声器系统可提高鲁棒性。 构对声波的反射、散射特性等。因此真实情况下,需
Zheng 等 [82] 将传输矩阵的简化自由场传输函数用 要实时跟踪检测听者头部运动,动态调整双耳重放
考虑人头散射的钢球模型代替,分析系统不同频率 系统相应参数。常用的头跟踪设备有电磁跟踪系统
的条件数,综合考虑串声消除系统鲁棒性和频率范 或摄像头 [89] ,激光扫描仪 (Laser scanner) [90] 或光
围提出线性扬声器阵列最优分布 (Linear optimal 学传感器 [91] 等。
source distribution)。在此基础上设计串消滤波器 真实倾听环境中,声源变化和听者运动是同步
时考虑多点控制,分频时低频以系统条件数为主要 且连续的,理想情况下,虚拟的双耳重放系统应能反
参考指标,高频时考虑传输函数相位畸变,提出八扬 映出这种动态信息,是线性时变系统。实际中应该
声器的线性鲁棒系统 [83] 。 考虑和解决的相关问题有 [2]
与 Ward 等 [79] 几乎同时, 南开普敦大学的 (1) 虚拟声学场景的刷新率 (Update rate) 问
Kirkeby 等 [84] 利用自由场模型模拟扬声器到人耳 题。刷新率表示动态双耳重放系统单位时间内的刷
传输过程理论分析串声消除,推导出扬声器与人 新次数,次数越高,听觉效果越接近真实的声源倾
头中心夹角和串声消除鲁棒频率的“环”频率 (Ring 听情况,相应的需要计算量也越大。实际应用中,受
frequency, RF) 关系,提出双扬声器角度 10 的立 软硬件能力的限制,虚拟的双耳重放系统的刷新率
◦
体声偶极子(Stereo dipole)系统。进一步,Takeuchi 应该在基于心理实验结果的基础上折中选择。早期
等 [85] 利用奇异值分解、系统条件数同时综合考虑 的 Sandvad 等 [92] 心理声学实验表明,刷新率应高
系统频率鲁棒性范围和扬声器重放时的动态范围 于10 Hz,否则会显著影响倾听者定位判断速度。
损失等因素提出了一个扬声器与人头中心夹角随 (2) 虚拟声学场景刷新的听觉连续性问题,
频率而变化的环形最优声源分布扬声器系统 (Op- 即从上一场景的信号输出平滑地过渡到新场景
timal source distribution, OSD),理论上解决了扬 信号的输出 (Crossfading)。常用的方法有输出过渡
声器重放对于不同频段的鲁棒性问题。具体实施 (Output crossfading)和参数过渡(Parameter cross-
时可利用分布在空间 ±90 ,±16 ,±3 六扬声器系 fading) [93] 。
◦
◦
◦
统来重放声源信号的不同频带范围 (低于 450 Hz, (3) 头跟踪系统引起的时间滞后问题。当听者
450∼3500 Hz,3500 Hz以上),在此基础上,Takeuchi 移动时,由双耳重放系统软硬件结构所决定的多种