文章摘要
郑凯桐,郑成诗,张玉龙,桑晋秋,李晓东.房间脉冲响应模拟法及混响时间盲估计应用*[J].,2023,42(2):260-268
房间脉冲响应模拟法及混响时间盲估计应用*
A room impulse response generator and its application on blind reverberation time estimation
投稿时间:2022-01-12  修订日期:2023-02-20
中文摘要:
      在构建混响语音数据集时,由于缺乏真实长混响房间脉冲响应且模拟的房间脉冲响应与真实不符,因而导致数据驱动的混响时间盲估计模型性能下降。提出了一种基于条件生成对抗网络的房间脉冲响应模拟法,该方法利用真实的房间脉冲响应训练条件生成对抗网络,可以根据指定的混响时间模拟更加真实的房间脉冲响应。使用不同方法模拟的房间脉冲响应构建训练集用于训练盲估计模型,通过声学实验评估模型性能。实验结果表明,由本方法模拟的房间脉冲响应训练的估计模型在不同信噪比下均具有最小的均方根误差且在长混响情况下显著优于其他模型。
英文摘要:
      The performance of data-driven blind reverberation time estimation network degrades because real room impulse response (RIR) lacks data with long reverberation time and there is a gap between real RIRs and simulated RIRs. In this paper, a room impulse response generator based on conditional Generative Adversarial Network is introduced. Trained with real RIRs, this network can generate room impulse responses with desired reverberation time. RIRs simulated by different methods are used to train the blind reverberation time estimators. Acoustic experiments are conducted to evaluate the performance of these estimators. The experimental results show that the estimator trained with simulated RIRs generated by the proposed method has a lower root mean square error than the baseline methods in different noisy scenarios and large reverberation scenarios.
DOI:10.11684/j.issn.1000-310X.2023.02.008
中文关键词: 房间脉冲响应模拟  混响时间  盲估计
英文关键词: room impulse response generator  blind estimation  reverberation time
基金项目:(12074403和11974086),国家自然科学基金项目(面上项目)
作者单位E-mail
郑凯桐 中国科学院声学研究所 zhengkaitong@mail.ioa.ac.cn 
郑成诗 中国科学院声学研究所 cszheng@mail.ioa.ac.cn 
张玉龙 中国科学院声学研究所 zylcup@163.com 
桑晋秋* 中国科学院声学研究所 sangjinqiu@mail.ioa.ac.cn 
李晓东 中国科学院声学研究所 lxd@mail.ioa.ac.cn 
摘要点击次数: 665
全文下载次数: 1089
查看全文   查看/发表评论  下载PDF阅读器
关闭