首页> 中文期刊> 《石河子大学学报:自然科学版》 >基于三层结构优化卷积神经网络的语音识别

基于三层结构优化卷积神经网络的语音识别

         

摘要

目前说话人、环境及发音多样性仍是语音识别声学建模中需解决的主要难题,为了克服这些不利因素的影响,本文将经过三层结构优化后的卷积神经网络应用于语音识别,利用卷积神经网络的卷积不变性克服语音信号的多样性,采用更符合生物神经元特性的新型激活函数改进卷积层缓解梯度消失的问题;利用中间池化方法改进池化层、减小特征提取误差,使用卷积层代替全连接层的方式降低模型复杂度,再通过与对比方法进行多种指标评价,结果表明:本文提出的方法较对比算法在中文语音、英文语音两种数据集下平均识别错误率分别下降22.05%和20.27%。比传统卷积神经网络模型的损失值相对减小40%,在一定程度上提升了模型的泛化能力。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号