Page 72 - 《应用声学》2023年第1期
P. 72
68 2023 年 1 月
0 引言 膜处的声信号与馈给耳机的声信号存在以下频域
关系:
耳机是一种直接与人耳耦合并在容积约为
E(k) = E p (k)M(k), (1)
2 cm 空腔内产生声压的电声换能器 [1] ,它作为最
3
常用的声重放设备,在现代通信、虚拟现实、听力 其中,E(k) 是鼓膜处实际声信号的第 k 个频谱分
康复、智能硬件等领域应用广泛。采用耳机进行 量,E p (k) 表示馈给耳机声信号的第 k 个频谱分量,
声重放时,双耳声信号依次经耳机重放、耳廓耦 M(k) 表示 HETF 的第 k 个频谱分量。为了消除耳
合与耳道传输到达鼓膜,引入了耳机到鼓膜的传 机传递特性的影响,可将实际的双耳信号声信号
递函数 (Headphone-to-eardrum transfer function, E d (k) 经均衡滤波器滤波后,再馈给耳机重放,表示
HETF) 。耳机和耳道的非理想传输特性会影响重 如下:
[2]
放中鼓膜接收声压的正确性,因而需要进行耳机 E p (k) = H(k)E d (k), (2)
均衡 [3] ,但由于 HETF 具有非常多的窄峰和谷 [4] ,
其中,H(k) 表示耳机均衡滤波器的频域特性。
直接用未平滑的 HETF 逆滤波器 [5] 进行耳机均衡
为 了 在 鼓 膜 处 准 确 地 重 放 双 耳 声 信 号, 要 求
不但信号处理困难 [6−7] ,且容易引起误差 [8−9] ,效
E(k) = E d (k),根据式(1)和式(2)有
果适得其反,因而需要对 HETF 做平滑处理。文
献 [10] 采用了广义分数倍频程对 HETF 进行平滑, H(k) = 1/M(k). (3)
但这种广义分数倍频程与人耳听觉感知的频率分 可见,理想的耳机均衡滤波器是 HETF 的逆
辨率不匹配。文献 [11–12] 通过统计方法对多次测 滤波器。为了保证均衡滤波器满足因果性和稳定
量的 HETF 近似取平均值,该方法虽然避免了均衡 性 [14] ,均衡目标函数需要加上一定的时延。耳机均
HETF 时引入高 Q 值频谱峰,但并未考虑人耳的听 衡时若无约束抬升 HETF 的低频与高频响应,可能
觉感知特性。文献 [13] 提出了一种用于 HETF 平滑 引起耳机系统响应的畸变、失真甚至损坏耳机。因
与均衡的自动正则化方法,通过测量的 HETF 自动 此,需要根据耳机的 HETF 来设计均衡滤波器的均
估计正则化因子,使均衡后的耳机产生更好的听觉 衡目标函数,以最大化的减小均衡误差。
感知效果。 本文采用有限冲激响应 (Finite impulse re-
基于上述背景,本文考虑到人耳听觉感知特性 sponse, FIR) 均衡方法 [15] 对实验耳机的 HETF 进
与耳机均衡实践经验,采用传统的 1/3 倍频程幅度 行均衡。该均衡方法的设计基于最小二乘准则与正
平滑方法 [10] 和提出的两种幅度平滑方法对 HETF 则化滤波器使均衡误差最小化。已有研究 [15−16] 表
进行平滑再做均衡,使均衡后的 HETF 保持一些 明,正则化滤波器有助于减小系统响应的时域混叠。
有助于人耳听觉感知的重要峰谷,以期更真实地 该均衡方法的频域表达式为
仿真人耳对高频区域 HETF 峰谷的感知特性,并避 D (k)M(k)
∗
H(k) = , (4)
免HETF 过渡均衡引入高 Q 值频谱峰,最终达到优 M(k)M (k) + β · B(k)B (k)
∗
∗
化耳机的听觉感知效果。一种幅度平滑方法是基 其中,β 表示正则化滤波器加权标量,B(k) 表示正
于 roex 滤波器平滑,该方法基于听觉滤波器的等 则化滤波器响应的傅里叶变换,D(k)表示理想带通
效矩形带宽来模拟人耳基底膜对频率的选择性与 滤波器响应的傅里叶变换。
分辨率。另一种幅度平滑方法是基于 Mel 频率倒谱
系数(Mel-frequency cepstrum coefficients, MFCC) 2 HETF平滑方法
平滑,该方法根据 Mel 尺度的频率仿真人耳对频率
2.1 1/3 Octave平滑
感知的非线性特征,能够充分模拟人耳的听觉感知
特性。研究结果表明,基于 MFCC 平滑的幅度均衡 1/3 倍频程 (1/3 Octave) [10] 作为声学频率的
对提高耳机的音色最为显著。 一种相对尺度,广泛应用于声频与声学频谱分析
等领域。它基于人耳的听觉相对声音的大小和
1 耳机均衡方法 频率具有对数关系的原则,对可听声的频率范围
20 Hz∼20 kHz进行了划分,能够很好地体现信号带
耳机重放时引入了HETF,实际到达聆听者鼓 宽的能量分布。假设上下截止频率各为 f u 与 f l 的