Page 72 - 《应用声学》2023年第1期
P. 72

68                                                                                   2023 年 1 月

             0 引言                                              膜处的声信号与馈给耳机的声信号存在以下频域
                                                               关系:
                 耳机是一种直接与人耳耦合并在容积约为
                                                                             E(k) = E p (k)M(k),          (1)
             2 cm 空腔内产生声压的电声换能器                [1] ,它作为最
                 3
             常用的声重放设备,在现代通信、虚拟现实、听力                            其中,E(k) 是鼓膜处实际声信号的第 k 个频谱分
             康复、智能硬件等领域应用广泛。采用耳机进行                             量,E p (k) 表示馈给耳机声信号的第 k 个频谱分量,
             声重放时,双耳声信号依次经耳机重放、耳廓耦                             M(k) 表示 HETF 的第 k 个频谱分量。为了消除耳
             合与耳道传输到达鼓膜,引入了耳机到鼓膜的传                             机传递特性的影响,可将实际的双耳信号声信号
             递函数 (Headphone-to-eardrum transfer function,      E d (k) 经均衡滤波器滤波后,再馈给耳机重放,表示
             HETF) 。耳机和耳道的非理想传输特性会影响重                          如下:
                   [2]
             放中鼓膜接收声压的正确性,因而需要进行耳机                                           E p (k) = H(k)E d (k),       (2)
             均衡  [3] ,但由于 HETF 具有非常多的窄峰和谷               [4] ,
                                                               其中,H(k) 表示耳机均衡滤波器的频域特性。
             直接用未平滑的 HETF 逆滤波器             [5]  进行耳机均衡
                                                               为 了 在 鼓 膜 处 准 确 地 重 放 双 耳 声 信 号, 要 求
             不但信号处理困难         [6−7] ,且容易引起误差       [8−9] ,效
                                                               E(k) = E d (k),根据式(1)和式(2)有
             果适得其反,因而需要对 HETF 做平滑处理。文
             献 [10] 采用了广义分数倍频程对 HETF 进行平滑,                                    H(k) = 1/M(k).              (3)
             但这种广义分数倍频程与人耳听觉感知的频率分                                 可见,理想的耳机均衡滤波器是 HETF 的逆
             辨率不匹配。文献 [11–12] 通过统计方法对多次测                       滤波器。为了保证均衡滤波器满足因果性和稳定
             量的 HETF 近似取平均值,该方法虽然避免了均衡                         性 [14] ,均衡目标函数需要加上一定的时延。耳机均
             HETF 时引入高 Q 值频谱峰,但并未考虑人耳的听                        衡时若无约束抬升 HETF 的低频与高频响应,可能
             觉感知特性。文献 [13] 提出了一种用于 HETF 平滑                     引起耳机系统响应的畸变、失真甚至损坏耳机。因
             与均衡的自动正则化方法,通过测量的 HETF 自动                         此,需要根据耳机的 HETF 来设计均衡滤波器的均
             估计正则化因子,使均衡后的耳机产生更好的听觉                            衡目标函数,以最大化的减小均衡误差。
             感知效果。                                                 本文采用有限冲激响应 (Finite impulse re-
                 基于上述背景,本文考虑到人耳听觉感知特性                          sponse, FIR) 均衡方法    [15]  对实验耳机的 HETF 进
             与耳机均衡实践经验,采用传统的 1/3 倍频程幅度                         行均衡。该均衡方法的设计基于最小二乘准则与正
             平滑方法    [10]  和提出的两种幅度平滑方法对 HETF                  则化滤波器使均衡误差最小化。已有研究                    [15−16]  表
             进行平滑再做均衡,使均衡后的 HETF 保持一些                          明,正则化滤波器有助于减小系统响应的时域混叠。
             有助于人耳听觉感知的重要峰谷,以期更真实地                             该均衡方法的频域表达式为
             仿真人耳对高频区域 HETF 峰谷的感知特性,并避                                              D (k)M(k)
                                                                                      ∗
                                                                     H(k) =                            ,  (4)
             免HETF 过渡均衡引入高 Q 值频谱峰,最终达到优                                     M(k)M (k) + β · B(k)B (k)
                                                                                    ∗
                                                                                                   ∗
             化耳机的听觉感知效果。一种幅度平滑方法是基                             其中,β 表示正则化滤波器加权标量,B(k) 表示正
             于 roex 滤波器平滑,该方法基于听觉滤波器的等                         则化滤波器响应的傅里叶变换,D(k)表示理想带通
             效矩形带宽来模拟人耳基底膜对频率的选择性与                             滤波器响应的傅里叶变换。
             分辨率。另一种幅度平滑方法是基于 Mel 频率倒谱
             系数(Mel-frequency cepstrum coefficients, MFCC)       2 HETF平滑方法
             平滑,该方法根据 Mel 尺度的频率仿真人耳对频率
                                                               2.1  1/3 Octave平滑
             感知的非线性特征,能够充分模拟人耳的听觉感知
             特性。研究结果表明,基于 MFCC 平滑的幅度均衡                             1/3 倍频程 (1/3 Octave)   [10]  作为声学频率的
             对提高耳机的音色最为显著。                                     一种相对尺度,广泛应用于声频与声学频谱分析
                                                               等领域。它基于人耳的听觉相对声音的大小和

             1 耳机均衡方法                                          频率具有对数关系的原则,对可听声的频率范围
                                                               20 Hz∼20 kHz进行了划分,能够很好地体现信号带
                 耳机重放时引入了HETF,实际到达聆听者鼓                         宽的能量分布。假设上下截止频率各为 f u 与 f l 的
   67   68   69   70   71   72   73   74   75   76   77