Page 6 - 《应用声学》2020年第2期
P. 6
164 2020 年 3 月
取,RIR 可以是在真实的房间中通过测量获得,并
0 引言
将其保存在内存中以便实时实现,但根据所需混
室内混响是声音从声源发出后由于不断被室 响特性寻找合适的房间是费时且不容易找到,测量
内表面反射、吸收而逐渐衰减的现象 [1−3] 。如果混 RIR 也需要耗费相当多的时间。因此,目前主要通
响过大,会使声音变得浑浊和杂乱,需要使用去混响 过算法合成 RIR,例如广泛使用的镜像源法 (Image
技术 [3−4] ,例如,在免提通信系统中使用去混响提 source method, ISM) [10] 能产生与真实房间非常相
高语音的可懂度和语音识别的准确率。然而,如果 似的 RIR,但是镜像源法计算房间脉冲响应所需要
缺乏适当的混响,声音或者音乐听起来会非常 “干 的镜像源的数量与 RIR 的长度 (阶数) 成立方比,与
燥”,听感不舒服,此时可以借助人工混响技术塑造 反射级数呈指数增长,这种大的计算量给其实时应
声音的空间感,使声音听起来更自然真实。因此,人 用带来较大困难。
工混响广泛应用于音乐、电影和虚拟现实中,以美 为了获得比反馈延迟网络方法更好的混响效
化音乐、声音的音色,进行艺术的再创造,产生特殊 果,又能比镜像源法有更少的计算量,从便于实时应
的音效 [5] 。 用的角度,本文研究了一种卷积法人工混响方法,将
人工混响最早是在 20 世纪 20 年代的广播系 RIR 分解成早期混响和后期混响两个部分:早期混
统 [5−6] 中通过模拟方法实现的,它将无混响信号 响可以用具有相应衰减因子的延时求和来表示;后
传输到混响环境 (一个专门建造的回音室) 中采集 期混响 RIR 受到文献 [11] 的启发,它在频域合成房
而得到。但是模拟方法对外部声学或机械的变化 间频率响应 (Room frequency response, RFR),再
扰动较敏感,并且需要专业知识来维护和调整混响 经傅里叶反变换得到时域 RIR,最后将干净无混响
效果。随着数字信号处理器的发展,人工混响可以 信号与RIR卷积得到混响信号。
通过数字方法实现,其中混响被看作是一个线性时
不变的过程 [5] 。数字人工混响方法主要有 3 种基本 1 频域合成房间频率响应的人工混响方法
类型 (尽管可以使用它们的组合):反馈延迟网络方
由信号处理理论可知,对于线性时不变系统,
法 (Feedback delay network, FDN)、计算声学方法
它的输出信号等于输入信号与系统的单位脉冲响
和卷积方法 [5] 。反馈延迟网络将输入信号 (干净无
应的卷积,
混响) 延迟、滤波并根据参数化混响特性沿着多个
路径反馈给前端,叠加后得到混响信号。该方法在 y(t) = x(t) ∗ h(t), (1)
音乐技术领域使用较多,但是通常只能产生需要的
其中,y(t) 为输出信号,x(t) 为输入信号,h(t) 为系
感知或者艺术效果 [7] 。二是基于计算声学的方法,
统的单位脉冲响应。若将房间看成一个线性时不
将输入信号模拟声能在几何模型中传播,从而得到 变系统,房间内的某一声源发出的声音经过房间的
混响信号,它通常用于需要准确度的声学设计和分
“处理” 传输到接收处,接收到的声音就是系统的输
析方案,如预测声学建模和声学空间的计算机辅助
出信号。房间脉冲响应就相当于系统的单位脉冲
设计,但它们难以用于实时性较高的场合 [5,8] 。三
响应。卷积法人工混响就是用 RIR h(t)与干净语音
是卷积方法,它将干净无混响信号与房间脉冲响
x(t)进行卷积,得到混响信号y(t)。
应(Room impulse response, RIR) 卷积得到混响信
h(t) 可以分解成早期混响和后期混响两个部
号,相当于用 RIR 对干净无混响信号进行有限脉冲
分,即
响应 (Finite impulse response, FIR) 滤波 [5] ,如果
选用的 RIR 能够逼近真实房间的 RIR,则卷积方法 h(t) = h e (t) + h l (t), (2)
的混响效果优于 FDN 和计算声学方法 [5] 。但是卷 其中,h e (t) 是早期房间脉冲响应,h l (t) 是后期房间
积方法的一个直接缺点是它的运算量较大,一部 脉冲响应。早期与后期混响之间的转换瞬间被称为
分运算量来自于用高阶 RIR 与干净无混响信号之 [11] 。
混合时间t 0
间的卷积运算,这部分运算量可以通过快速卷积算 ⌊ √ ⌋
t 0 = C 0 V f s , (3)
法一定程度上加以缓解 [9] ;另一个来自于 RIR 的获