首页> 中文会议>第十四届全国人机语音通讯学术会议 >基于注意力的端到端韵律结构和重音联合预测方法

基于注意力的端到端韵律结构和重音联合预测方法

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文提出了一种基于注意力的端到端韵律结构和重音联合预测方法,首次将韵律结构预测和重音预测统一到同一框架中.该方法是基于端到端的,无需任何人为的特征处理工作.其基本框架是一个RNN“编码-解码”模型,在此基础上本文逐渐引入了字embedding层、“编码-解码”时的对齐信息、注意力机制和多任务学习,并详细探讨了它们在韵律结构预测和重音预测上所发挥的作用.实验结果表明,相比于目前在韵律结构和重音预测上最好的方法(Bi-LSTM),本文提出的方法在韵律词、韵律短语、语调短语和重音预测上分别在客观指标(F1Score)上有了进一步提高;合成语音的主观结果也表明,本文提出的方法能够提高语音合成的自然度和表现力.

著录项

来源
《第十四届全国人机语音通讯学术会议》|2017年|1-6|共6页
会议地点江苏连云港
作者
ZHENG Yibin; 郑艺斌; TAO Jianhua; 陶建华; LI Ya; 李雅; WEN Zhengqi; 温正棋;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音合成;
关键词
语音合成; 韵律结构; 重音预测; 注意力模型;

相似文献

中文文献
外文文献
专利

1. 基于注意力机制的联合监督端到端说话人识别模型 [J] . 史王雷 ,冯爽 . 信息与电脑 . 2020,第004期
2. 基于残差注意力U-Net结构的端到端歌声分离模型 [J] . 汪斌 ,陈宁 . 华东理工大学学报（自然科学版） . 2021,第005期
3. 基于哈希自注意力端到端网络的三维模型草图检索 [J] . 赵旭飞 ,潘翔 ,刘复昌 . 计算机辅助设计与图形学学报 . 2021,第005期
4. T-STAM:基于双流时空注意力机制的端到端的动作识别模型 [J] . 石祥滨 ,李怡颖 ,刘芳 . 计算机应用研究 . 2021,第004期
5. 基于注意力机制和离散高斯混合模型的端到端图像压缩方法 [J] . 朱俊 ,高陈强 ,陈志乾 . 重庆邮电大学学报（自然科学版） . 2020,第005期
6. 注意力的端到端模型生成藏文律诗 [C] . SeChaJia ,色差甲 ,HuaGuoCaiRang . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于自注意力机制的端到端语音识别方法研究 [A] . 雷志超 . 2020

基于注意力的端到端韵律结构和重音联合预测方法

摘要

著录项

相似文献

相关主题

期刊订阅