Page 79 - 201901
P. 79

第 38 卷 第 1 期               苗晓孔等: 采用骨导语音自适应的语句分割方法                                            75


                                       表 2   四种分割算法在不同噪声环境下分割的正确率
                           Table 2  Accuracy rate of four segmentation algorithms for different
                           noise environments

                                                        (骨导) 单特征     (骨导) 融合特征     (气导含噪) 融合
                                               本文算法
                                                           分割法         固定阈值法           特征法
                             男 (音乐背景噪声)         96%        79.4%        89.5%          74%
                           男 (嘈杂人声背景噪声)         94.5%      71.2%        86.2%          67.2%
                             男 (车辆鸣笛噪声)         92.2%      67.5%        80.2%          64.6%
                             女 (音乐背景噪声)         98.6%      83.6%         93%           76.5%
                           女 (嘈杂人声背景噪声)         96.7%      78%          89.6%          74%
                             女 (车辆鸣笛噪声)         94.2%      70.6%         85%           65.8%

                                                                   short-time zero crossing rate[J]. Electronic Science and
             4 结论                                                  Technology, 2016, 29(9): 52–55.
                                                                 [4] 赵新燕, 王炼红, 彭林哲. 基于自适应倒谱距离的强噪声语音
                 本文利用骨导语音具有的优良抗噪性,在对骨                              端点检测 [J]. 计算机科学, 2015, 42(9): 83–85, 117.
             导语音预处理的基础上提出了一种自适应的分段                                 Zhao Xinyan, Wang Lianhong, Peng Linzhe. Adaptive
             双门限语音分割算法,通过时域特征融合、引入随                                cepstral distance-based voice endpoint detection of strong
                                                                   noise[J]. Computer Science, 2015, 42(9): 83–85, 117.
             机动态阈值以及分段双门限检测等多个方面改善                               [5] 王群, 曾庆宁, 郑展恒. 低信噪比下语音端点检测算法的改进
             语音分割效果,并通过实验证明了其有效性和鲁棒                                研究 [J]. 科学技术与工程, 2017, 17(21): 50–56.
             性。针对需要同步录制背景噪声或某些信噪比较低                                Wang Qun, Zeng Qingning, Zheng Zhanheng. Research
                                                                   of speech endpoint detection in low SNR environment[J].
             情况下的语句分割问题,找到一种最接近手工分割
                                                                   Science Technology and Engineering, 2017, 17(21): 50–56.
             结果的端点位置,从而达到对噪声环境下的连续语                              [6] You D, Han J, Zheng G, et al. Sparse power spectrum
             音进行分割的目的,且分割精度和准确度获得一定                                based robust voice activity detector[C]//2012 IEEE Inter-
                                                                   national Conference on Acoustics, Speech and Signal Pro-
             程度上的提高。当然,算法还存在一些可以继续完
                                                                   cessing (ICASSP), 2012: 289–292.
             善的地方,例如:在相似度判定上还可以做进一步的                             [7] 曹亮, 张天骐, 周圣, 等. 一种基于奇异谱的语音激活检测方
             自适应调整,根据语音长度和整个语句信息的相关                                法 [J]. 应用声学, 2013, 32(2): 137–143.
             参数确定一个变化的相似度阈值,可以使算法的性                                Cao Liang, Zhang Tianqi, Zhou Sheng, et al. A method
                                                                   of voice activity detection based on spectrum of singular
             能进一步拓展,后续相关工作也可以在这方面进行
                                                                   value[J]. Applied Acoustics, 2013, 32(2): 137–143.
             相应的实验和改进。                                           [8] Wu J, Zhang X L. Efficient multiple kernel support vec-
                                                                   tor machine based voice activity detection[J]. IEEE Signal
                                                                   Processing Letters, 2011, 18(8): 466–469.
                            参 考     文   献                        [9] Zhang X L, Wu J. Deep belief networks based voice ac-
                                                                   tivity detection[J]. IEEE Transactions on Audio, Speech,
              [1] 洪奕鑫, 张浩川, 余荣, 等. 语音端点检测在实时语音截取中                  and Language Processing, 2013, 21(4): 697–710.
                 的应用 [J]. 无线互联科技, 2017(22): 50–53.              [10] 王晓华, 屈雷. 基于时频参数融合的自适应语音端点检测算
                 Hong Yixin, Zhang Haochuan, Yu Rong, et al. Appli-  法 [J]. 计算机工程与应用, 2015, 51(20): 203–207, 212.
                 cation of speech endpoint detection in real time speech  Wang Xiaohua, Qu Lei. Self-adaptive voice activity de-
                 interception[J]. Wireless Internet Technology, 2017(22):  tection algorithm based on fusion of time-frequency para-
                 50–53.                                            meter[J]. Computer Engineering and Applications, 2015,
              [2] 吕卫强, 黄荔. 基于短时能量加过零率的实时语音端点检测方                    51(20): 203–207.
                 法 [J]. 兵工自动化, 2009, 28(9): 69–70, 73.          [11] 戴元红, 陈鸿昶, 乔德江, 等. 基于短时能量比的语音端点检
                 Lyu Weiqiang, Huang Li.  Realtime voice activity de-  测算法的研究 [J]. 通信技术, 2009, 42(2): 181–183.
                 tection based on short time energy plus rate of pass-  Dai Yuanhong, Chen Hongchang, Qiao Dejiang, et al.
                 ing zero[J]. Ordnance Industry Automation, 2009, 28(9):  Speech endpoint detection algorithm analysis based on
                 69–70, 73.                                        short-term energy ratio[J]. Communications Technology,
              [3] 纪振发, 杨晖, 李然, 等. 基于短时自相关及过零率的语音端                  2009, 42(2): 181–183.
                 点检测算法 [J]. 电子科技, 2016, 29(9): 52–55.           [12] Patel R, Shrawankar U. Security issues in speech water-
                 Ji Zhenfa, Yang Hui, Li Ran, et al. Speech endpoint de-  marking for information transmission[J]. Computer Sci-
                 tection algorithm based on short time autocorrelation and  ence, 2013: 830–839.
   74   75   76   77   78   79   80   81   82   83   84