基于改进混合CTC/attention架构的端到端普通话语音识别

杨鸿武; 周刚

首页> 中文期刊>西北师范大学学报（自然科学版） >基于改进混合CTC/attention架构的端到端普通话语音识别

基于改进混合CTC/attention架构的端到端普通话语音识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification,CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection,BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8％的词错误率.

著录项

来源
《西北师范大学学报（自然科学版）》|2019年第3期|48-53|共6页
作者
杨鸿武; 周刚;
展开▼
作者单位

西北师范大学物理与电子工程学院,甘肃兰州 730070;

西北师范大学物理与电子工程学院,甘肃兰州 730070;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;自动推理、机器学习;
关键词
语音识别; 链接时序分类; 注意力机制; 混合CTC/attention; 端到端系统;

相似文献

中文文献
外文文献
专利

1. 混合CTC/attention架构端到端带口音普通话识别 [J] . 杨威 ,胡燕 . 计算机应用研究 . 2021,第003期
2. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
3. 一种基于CNN/CTC的端到端普通话语音识别方法 [J] . 潘粤成 ,刘卓 ,潘文豪 . 现代信息科技 . 2020,第005期
4. 改进卷积输入的端到端普通话语音识别 [J] . 王彦哲 ,张立民 ,张兵强 . 计算机工程与应用 . 2019,第017期
5. 基于HOPE-CTC的端到端语音识别 [J] . 徐冬冬 ,蒋志翔 . 计算机工程与设计 . 2021,第002期
6. 一种新的基于策略的端到端移动QoS体系架构 [C] . 徐晓宇 ,张惠民 . 2004年全国通信软件技术学术年会 . 2004
7. 基于CTC方法的端到端语音识别系统研究与实现 [A] . 卢阳 . 2019

基于改进混合CTC/attention架构的端到端普通话语音识别

摘要

著录项

相似文献

相关主题

期刊订阅