基于说话人自适应训练的统计参数语音合成的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

目前的合成语音效果不断改善,但为了能够充分地传递出语音中包含的更多信息,TTS系统需要能产生更为自然的任意说话人的声音。虽然基于波形拼接的大语料库语音合成系统能够合成高可懂度和自然度的合成语音,但语音库的构建费时费力,而且难以实现不同说话人、不同情感的合成语音。基于HMM的统计参数语音合成系统虽然能够合成出不同说话人的语音,但合成语音的自然度不是很高。因此,一种利用说话人的少量训练语句合成出具有目标说话人特点的说话人自适应语音合成方法,成为当前一个重要的研究热点。论文以基于HMM统计参数语音合成为研究基础,采用说话人自适应训练,利用多个说话人的训练语音,实现了一个普通话的多说话人统计参数语音合成系统,能够合成出不同目标说话人语音,合成效果优于单说话人的说话人相关模型的合成结果。论文的主要研究工作及创新如下。
　　1.根据《现代汉语词典》,从汉语发音的基本单元出发,对汉语声、韵母分类划分,分析了连续语句中语境相关的信息,并以此为基础设计了连续语句语境信息的标注方案。采用上下文相关的方法将语境信息从小到大分为六层,分别设计出各个层级的标注格式和标注内容,然后对语音信息及其上下文关系进行了标注设计,并实现了一个面向HTS系统的汉语普通话上下文相关的标注产生程序。
　　2.根据汉语普通话的发音特点和韵律特点,实现了一个面向HTS系统的问题集生成程序,可以生成音段相关和韵律相关的问题,用于HTS系统中对模型状态的决策树聚类。
　　3.利用说话人自适应训练方法实现了一个基于HMM的普通话多说话人语音合成系统。该系统利用多个说话人的训练语句获得一个平均音模型,并利用说话人自适应变换获得不同说话人的说话人相关模型。实验结果表明,本文提出的方法,其MOS得分和DMOS得分均优于仅使用一个说话人的训练语句训练的说话人相关模型的结果。

著录项

作者
宋文龙;
展开▼
作者单位

西北师范大学;

展开▼
授予单位西北师范大学;
学科电子与通信工程
授予学位硕士
导师姓名杨鸿武;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音合成;
关键词
说话人自适应训练; 语音合成系统; HTS系统; 标注设计;

相似文献

中文文献
外文文献
专利

1. 基于多情感说话人自适应的情感语音合成研究 [J] . 李葵 ,徐海青 ,吴立刚 . 湘潭大学自然科学学报 . 2018,第004期
2. 基于多情感说话人自适应的情感语音合成研究 [J] . 李葵12 ,徐海青3 ,吴立刚3 . 湘潭大学学报：自然科学版 . 2018,第004期
3. 利用说话人自适应实现基于DNN的情感语音合成 [J] . 智鹏鹏 ,杨鸿武 ,宋南 . 重庆邮电大学学报（自然科学版） . 2018,第005期
4. 基于最大后验概率的语音合成说话人自适应 [J] . 赵欢欢 ,凌震华 ,王仁华 . 数据采集与处理 . 2010,第004期
5. 基于GMM统计参数和SVM的说话人辨认研究 [J] . 贺志阳 ,张玲华 . 南京邮电大学学报（自然科学版） . 2006,第003期
6. 基于说话人自适应训练的汉藏双语语音合成 [C] . WANG Haiyan ,王海燕 ,YANG Hongwu . 第十二届全国人机语言通讯学术会议（NCMMSC`2013） . 2013
7. 基于自适应实例归一化的多说话人语音合成模型 [A] . 徐珊 . 2020

基于说话人自适应训练的统计参数语音合成的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅