首页> 中文期刊> 《电视技术》 >基于混合注意力机制和CTC语音识别模型技术研究

基于混合注意力机制和CTC语音识别模型技术研究

         

摘要

cqvip:近年来,基于混合的连续时间分类(CTC)和注意力编解码器模型的端到端语音识别取得了很好的效果。文章在实验的基础上,提出了一种新的基于译码性能与编码器深度关系的CTC译码器结构,并运用注意力平滑机制获取更多的上下文信息,实现基于子字的译码。该方法在语音识别数据集Voxforge中的测试结果为,在没有LM的情况下,词错误率降到了4.39%;在RNN-LM的情况下,词错误率降到了3.32%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号