Page 130 - 201805
P. 130

712                                                                                  2018 年 9 月


             spot) 则说明人头转动或移动时串消系统鲁棒性能。                        等 [86]  又分析提出了扩展的三通道OSD系统。
             将两者结合,为提高串消系统的总体鲁棒性能,以串                               一般的串声消除均是考虑单一听者,理论上,扬
             消系统条件数为基础或者实验中理论分析最佳听                             声器双耳重放设计对应的理想串声消除系统,多个
             音区域大小确定扬声器听者位置和数目寻找鲁棒                             听者都能感受到三维音效,但实际应用仍较为困难,
             的扬声器与听者布置,相应的研究主要分为两大类:                           对应的研究还较少。早期,Kim等              [87]  利用自由场传
             线性扬声器阵列分布和环形扬声器阵列分布。                              输函数基于条件数鲁棒性分析,对多扬声器多听者
                 早期,Ward等     [79]  将扬声器到人耳的传输函数               串声消除系统 (主要是 4 扬声器 4 听者) 进行了初步
             利用简单自由场模拟 (其后又用一个简化结构模型                           的理论分析和研究。进一步地,Masiero 等                [88]  考虑
             验证),定义一简单代价函数模拟人头前后左右移动                           声波衍射将听者人头用钢球模拟 (Rigid sphere) 基
             对串声消除性能的影响,得出在频率600 Hz 以上扬                        于条件数理论分析了线性扬声器分布和圆形扬声
             声器之间距离分布的鲁棒性与频率成反比。针对声                            器分布的 4 扬声器 2 听者串消系统,得出实际中不
             源的不同频率,不同扬声器应按不同间隔摆放,这可                           同频率扬声器鲁棒性分布间隔不同且相差较大,实
             以看成是线性扬声器阵列 (Linear loudspeaker ar-               现较为困难。
             ray) 思想的雏形。在此基础上,Ward 等             [80]  又利用
             传输矩阵的条件数,进一步来论证串声消除的鲁棒                            6 听者头部运动跟踪
             性,提出一个简化的针对频率范围 400 Hz∼5 kHz
             的分频带线性三扬声器串声消除系统。Yang 等                    [81]       实际自然的听觉环境,听者头部会移动或者转
                                                               动,其会改变声源到听者的传输路径和听者生理结
             对三扬声器整体重放的传输矩阵利用条件数进行
             鲁棒性分析,论证得出三扬声器系统可提高鲁棒性。                           构对声波的反射、散射特性等。因此真实情况下,需
             Zheng 等 [82]  将传输矩阵的简化自由场传输函数用                    要实时跟踪检测听者头部运动,动态调整双耳重放
             考虑人头散射的钢球模型代替,分析系统不同频率                            系统相应参数。常用的头跟踪设备有电磁跟踪系统
             的条件数,综合考虑串声消除系统鲁棒性和频率范                            或摄像头     [89] ,激光扫描仪 (Laser scanner)   [90]  或光
             围提出线性扬声器阵列最优分布 (Linear optimal                    学传感器     [91]  等。
             source distribution)。在此基础上设计串消滤波器                     真实倾听环境中,声源变化和听者运动是同步
             时考虑多点控制,分频时低频以系统条件数为主要                            且连续的,理想情况下,虚拟的双耳重放系统应能反
             参考指标,高频时考虑传输函数相位畸变,提出八扬                           映出这种动态信息,是线性时变系统。实际中应该

             声器的线性鲁棒系统          [83] 。                         考虑和解决的相关问题有            [2]
                 与 Ward 等  [79]  几乎同时, 南开普敦大学的                     (1) 虚拟声学场景的刷新率 (Update rate) 问
             Kirkeby 等  [84]  利用自由场模型模拟扬声器到人耳                  题。刷新率表示动态双耳重放系统单位时间内的刷
             传输过程理论分析串声消除,推导出扬声器与人                             新次数,次数越高,听觉效果越接近真实的声源倾
             头中心夹角和串声消除鲁棒频率的“环”频率 (Ring                        听情况,相应的需要计算量也越大。实际应用中,受
             frequency, RF) 关系,提出双扬声器角度 10 的立                  软硬件能力的限制,虚拟的双耳重放系统的刷新率
                                                     ◦
             体声偶极子(Stereo dipole)系统。进一步,Takeuchi               应该在基于心理实验结果的基础上折中选择。早期
             等  [85]  利用奇异值分解、系统条件数同时综合考虑                      的 Sandvad 等  [92]  心理声学实验表明,刷新率应高
             系统频率鲁棒性范围和扬声器重放时的动态范围                             于10 Hz,否则会显著影响倾听者定位判断速度。
             损失等因素提出了一个扬声器与人头中心夹角随                                 (2) 虚拟声学场景刷新的听觉连续性问题,
             频率而变化的环形最优声源分布扬声器系统 (Op-                          即从上一场景的信号输出平滑地过渡到新场景
             timal source distribution, OSD),理论上解决了扬           信号的输出 (Crossfading)。常用的方法有输出过渡
             声器重放对于不同频段的鲁棒性问题。具体实施                             (Output crossfading)和参数过渡(Parameter cross-
             时可利用分布在空间 ±90 ,±16 ,±3 六扬声器系                      fading) [93] 。
                                               ◦
                                          ◦
                                    ◦
             统来重放声源信号的不同频带范围 (低于 450 Hz,                           (3) 头跟踪系统引起的时间滞后问题。当听者
             450∼3500 Hz,3500 Hz以上),在此基础上,Takeuchi             移动时,由双耳重放系统软硬件结构所决定的多种
   125   126   127   128   129   130   131   132   133   134   135