首页> 中文会议>第十四届全国人机语音通讯学术会议 >一种应用于短时语音语种识别的时长扩展方法

一种应用于短时语音语种识别的时长扩展方法

摘要

为解决待识别语音时长小于10s时,语种识别性能急剧下降的问题.本文提出应用语音时域伸缩(time-scale modification,TSM)技术改变语音的长度(从而改变了语速),并保持其他频域信息不变.本文所提算法实现方式如下:首先,对一段待识别语音,应用TSM技术转换为多条时域压缩和时域拉伸后的语音.然后,将这些不同语速的语音与原语音拼接起来,生成一个时长较长的语音,最后送入语种识别系统进行识别.实验结果证明所提出的语音时长扩展算法可以显著提升短时语音的语种识别性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号