首页> 外文会议>映像情報メディア学会大会 >日本語end-to-end音声合成における発話スタイル制御に関する検討
【24h】

日本語end-to-end音声合成における発話スタイル制御に関する検討

机译:日本末端语音合成中语音风格控制研究

获取原文

摘要

番組制作の意図に沿った放送品質の音声合成を実現するためには、番組の演出要件に応じて発話スタイルを制御することが重要である。例えばニュース、スポーツ実況、ドキュメンタリーなど、番組によってそれぞれ異なる発話スタイルが求められる。そこで、Encoder-DecoderモデルのDNN(Deep Neural Network)を用いた日本語 end-to-end 音声合成において、これらの番組特有の発話スタイルを再現する方式を提案する。今回、提案手法で作成した合成音声について主観評価実験を実施し、その有効性を検証したので報告する。
机译:为了实现沿程编程生产的临时广播质量的语音合成,重要的是根据程序效应要求控制语音风格。例如,不同的语音样式由节目确定,例如新闻,体育和纪录片。因此,我们提出了一种使用编码器 - 解码器模型的DNN(深神经网络)在日本端到端语音合成中再现这些程序特定语音样式的方法。这次,我们对所提出的方法创建的合成语音进行主观评估实验,并验证其有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号