首页> 中文期刊> 《计算机与数字工程》 >基于LPCNet的语音合成方法研究

基于LPCNet的语音合成方法研究

         

摘要

针对诸如WaveNet的神经声码器合成语音缓慢和模型复杂的问题,提出一种基于LPCNet的语音合成方法.首先将中文带调拼音序列作为输入,然后通过引入Query-Key self attention注意力机制的Seq2Seq(Sequence to Sequence)特征预测网络生成相应的梅尔声谱图,最后使用LPCNet模型将梅尔声谱图还原为语音波形.实验结果表明,主观评测MOS(Mean Opinion Score)得分4.07,客观评测MCD(Mel Cepstral Distance)得分12.14,合成语音的质量优于参数式语音合成模型和采用传统声码器的Seq2Seq语音合成模型,是一种优良的语音合成方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号