Page 79 - 201901
P. 79
第 38 卷 第 1 期 苗晓孔等: 采用骨导语音自适应的语句分割方法 75
表 2 四种分割算法在不同噪声环境下分割的正确率
Table 2 Accuracy rate of four segmentation algorithms for different
noise environments
(骨导) 单特征 (骨导) 融合特征 (气导含噪) 融合
本文算法
分割法 固定阈值法 特征法
男 (音乐背景噪声) 96% 79.4% 89.5% 74%
男 (嘈杂人声背景噪声) 94.5% 71.2% 86.2% 67.2%
男 (车辆鸣笛噪声) 92.2% 67.5% 80.2% 64.6%
女 (音乐背景噪声) 98.6% 83.6% 93% 76.5%
女 (嘈杂人声背景噪声) 96.7% 78% 89.6% 74%
女 (车辆鸣笛噪声) 94.2% 70.6% 85% 65.8%
short-time zero crossing rate[J]. Electronic Science and
4 结论 Technology, 2016, 29(9): 52–55.
[4] 赵新燕, 王炼红, 彭林哲. 基于自适应倒谱距离的强噪声语音
本文利用骨导语音具有的优良抗噪性,在对骨 端点检测 [J]. 计算机科学, 2015, 42(9): 83–85, 117.
导语音预处理的基础上提出了一种自适应的分段 Zhao Xinyan, Wang Lianhong, Peng Linzhe. Adaptive
双门限语音分割算法,通过时域特征融合、引入随 cepstral distance-based voice endpoint detection of strong
noise[J]. Computer Science, 2015, 42(9): 83–85, 117.
机动态阈值以及分段双门限检测等多个方面改善 [5] 王群, 曾庆宁, 郑展恒. 低信噪比下语音端点检测算法的改进
语音分割效果,并通过实验证明了其有效性和鲁棒 研究 [J]. 科学技术与工程, 2017, 17(21): 50–56.
性。针对需要同步录制背景噪声或某些信噪比较低 Wang Qun, Zeng Qingning, Zheng Zhanheng. Research
of speech endpoint detection in low SNR environment[J].
情况下的语句分割问题,找到一种最接近手工分割
Science Technology and Engineering, 2017, 17(21): 50–56.
结果的端点位置,从而达到对噪声环境下的连续语 [6] You D, Han J, Zheng G, et al. Sparse power spectrum
音进行分割的目的,且分割精度和准确度获得一定 based robust voice activity detector[C]//2012 IEEE Inter-
national Conference on Acoustics, Speech and Signal Pro-
程度上的提高。当然,算法还存在一些可以继续完
cessing (ICASSP), 2012: 289–292.
善的地方,例如:在相似度判定上还可以做进一步的 [7] 曹亮, 张天骐, 周圣, 等. 一种基于奇异谱的语音激活检测方
自适应调整,根据语音长度和整个语句信息的相关 法 [J]. 应用声学, 2013, 32(2): 137–143.
参数确定一个变化的相似度阈值,可以使算法的性 Cao Liang, Zhang Tianqi, Zhou Sheng, et al. A method
of voice activity detection based on spectrum of singular
能进一步拓展,后续相关工作也可以在这方面进行
value[J]. Applied Acoustics, 2013, 32(2): 137–143.
相应的实验和改进。 [8] Wu J, Zhang X L. Efficient multiple kernel support vec-
tor machine based voice activity detection[J]. IEEE Signal
Processing Letters, 2011, 18(8): 466–469.
参 考 文 献 [9] Zhang X L, Wu J. Deep belief networks based voice ac-
tivity detection[J]. IEEE Transactions on Audio, Speech,
[1] 洪奕鑫, 张浩川, 余荣, 等. 语音端点检测在实时语音截取中 and Language Processing, 2013, 21(4): 697–710.
的应用 [J]. 无线互联科技, 2017(22): 50–53. [10] 王晓华, 屈雷. 基于时频参数融合的自适应语音端点检测算
Hong Yixin, Zhang Haochuan, Yu Rong, et al. Appli- 法 [J]. 计算机工程与应用, 2015, 51(20): 203–207, 212.
cation of speech endpoint detection in real time speech Wang Xiaohua, Qu Lei. Self-adaptive voice activity de-
interception[J]. Wireless Internet Technology, 2017(22): tection algorithm based on fusion of time-frequency para-
50–53. meter[J]. Computer Engineering and Applications, 2015,
[2] 吕卫强, 黄荔. 基于短时能量加过零率的实时语音端点检测方 51(20): 203–207.
法 [J]. 兵工自动化, 2009, 28(9): 69–70, 73. [11] 戴元红, 陈鸿昶, 乔德江, 等. 基于短时能量比的语音端点检
Lyu Weiqiang, Huang Li. Realtime voice activity de- 测算法的研究 [J]. 通信技术, 2009, 42(2): 181–183.
tection based on short time energy plus rate of pass- Dai Yuanhong, Chen Hongchang, Qiao Dejiang, et al.
ing zero[J]. Ordnance Industry Automation, 2009, 28(9): Speech endpoint detection algorithm analysis based on
69–70, 73. short-term energy ratio[J]. Communications Technology,
[3] 纪振发, 杨晖, 李然, 等. 基于短时自相关及过零率的语音端 2009, 42(2): 181–183.
点检测算法 [J]. 电子科技, 2016, 29(9): 52–55. [12] Patel R, Shrawankar U. Security issues in speech water-
Ji Zhenfa, Yang Hui, Li Ran, et al. Speech endpoint de- marking for information transmission[J]. Computer Sci-
tection algorithm based on short time autocorrelation and ence, 2013: 830–839.