首页> 中文会议>第十四届全国人机语音通讯学术会议 >基于注意力的端到端韵律结构和重音联合预测方法

基于注意力的端到端韵律结构和重音联合预测方法

摘要

本文提出了一种基于注意力的端到端韵律结构和重音联合预测方法,首次将韵律结构预测和重音预测统一到同一框架中.该方法是基于端到端的,无需任何人为的特征处理工作.其基本框架是一个RNN“编码-解码”模型,在此基础上本文逐渐引入了字embedding层、“编码-解码”时的对齐信息、注意力机制和多任务学习,并详细探讨了它们在韵律结构预测和重音预测上所发挥的作用.实验结果表明,相比于目前在韵律结构和重音预测上最好的方法(Bi-LSTM),本文提出的方法在韵律词、韵律短语、语调短语和重音预测上分别在客观指标(F1Score)上有了进一步提高;合成语音的主观结果也表明,本文提出的方法能够提高语音合成的自然度和表现力.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号