Page 5 - 《应该声学》2022年第2期
P. 5

第 41 卷 第 2 期                                                                       Vol. 41, No. 2
             2022 年 3 月                          Journal of Applied Acoustics                    March, 2022

             ⋄ 研究报告 ⋄



                    子带t分布的快速独立向量分析在语声盲源


                                               分离中的应用                    ∗



                                          康 坊     1,2  杨飞然      1,2  杨 军     1,2†



                                              (1 中国科学院声学研究所       北京   100190)
                                                (2 中国科学院大学      北京  100049)

                摘要:为了提高独立向量分析算法在盲语声分离任务中的分离性能,降低算法计算复杂度,并改善目前尚未完
                全解决的顺序模糊性的问题,该文提出一种基于子带 t 分布的快速独立向量分析算法。在声源模型方面,该算
                法首先利用语声信号重尾分布的特性,假设声源概率密度函数服从 t 分布,同时采用子带建模的方法来增强同
                一声源相邻频点的高阶依赖性,进而减轻频点间的顺序不一致问题。在空间模型方面,该算法采用秩 1 更新的
                方式估计声源信号,避免矩阵求逆操作和分离矩阵的估计,从而降低计算复杂度。实验结果表明,与现有的基
                于独立向量分析的盲源分离算法相比,该算法能够在相同的迭代次数下取得更优的语声分离性能。
                关键词:盲源分离;秩 1 更新;独立向量分析;子带 t 分布
                中图法分类号: TN912           文献标识码: A          文章编号: 1000-310X(2022)02-0173-09
                DOI: 10.11684/j.issn.1000-310X.2022.02.001




                Fast independent vector analysis based on clique t-distribution source model
                                             for blind speech separation



                                      KANG Fang   1,2  YANG Feiran 1,2  YANG Jun 1,2


                               (1 Institute of Acoustics, Chinese Academy of Sciences, Beijing 100190, China)
                                   (2 University of Chinese Academy of Sciences, Beijing 100049, China)

                 Abstract: We propose a novel fast independent vector analysis based on clique t-distribution source model.
                 The proposed method assumes that the source generative model follows the complex Student’s t distribution
                 which is known to be more suited for speech signals. We independently model sources in each overlapping
                 frequency clique to improve the dependence among neighboring frequencies and further solve the permutation
                 problem. Furthermore, we integrate the modified source model into the iterative source steering algorithm
                 to reduce the computational cost via rank-1 update rules. The experimental results show that the proposed
                 method achieves a better speech separation performance than the conventional methods.
                 Keywords: Blind source separation; Rank-1 update; Independent vector analysis; Clique t-distribution





             2021-03-15 收稿; 2021-05-31 定稿
             国家重点研发计划项目 (2017YFC0804900), 国家自然科学基金项目 (62171438), 中国科学院青年促进会资助项目 (2018027)
             ∗
             作者简介: 康坊 (1993– ), 女, 山东潍坊人, 博士研究生, 研究方向: 盲源分离。
             † 通信作者 E-mail: jyang@mail.ioa.ac.cn
   1   2   3   4   5   6   7   8   9   10