首页> 中文期刊> 《计算机与现代化》 >面向数据增强的轻量化语音情感识别

面向数据增强的轻量化语音情感识别

         

摘要

利用深度学习进行语音情感识别时通常需要大量的训练数据。针对现有语音情感数据库匮乏且数据量少容易造成过拟合的缺陷,本文在预处理阶段,将原始语音通过加入高斯白噪声和对波形进行位移产生新的语音信号以实现数据增强,不仅可提高识别准确率而且可增强模型的鲁棒性。与此同时,由于普通卷积神经网络参数量过大,提出一种轻量化模型,该模型由可分离卷积与门控循环单元构成。首先,从原始语音中提取MFCC特征作为模型的输入;其次利用可分离卷积来提取语音空间信息,门控循环单元提取语音的时序信息,用时序信息和空间信息同时表征语音情感可以使预测结果更加准确;最后送入带有softmax的全连接层完成情感分类。实验结果表明,本文模型与基准模型相比不仅可以得到较高的准确率且模型可压缩约50%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号