首页> 中文学位 >基于说话人自适应训练的统计参数语音合成的研究
【6h】

基于说话人自适应训练的统计参数语音合成的研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1研究背景

1.2语音合成的方法介绍

1.3研究目的及意义

1.4论文的研究内容及组织

1.5本章小结

第2章 基于HMM统计参数语音合成的方法

2.1HMM简介

2.2基于HMM的语音合成原理

2.3说话人相关模型的语音合成

2.4基于HMM的参数语音合成方法的特点

2.5本章小结

第3章 基于多说话人的自适应训练

3.1平均音模型

3.2说话人自适应训练

3.3最大后验概率

3.4说话人自适应TTS系统

3.5本章小结

第4章 语境信息的标注及问题集的设计

4.1上下文相关的标注

4.2问题集的设计

4.3本章小结

第5章 实验及评测

5.1实验数据的来源

5.2实验过程

5.3实验评测

5.4本章小结

第6章 总结与展望

参考文献

致谢

展开▼

摘要

目前的合成语音效果不断改善,但为了能够充分地传递出语音中包含的更多信息,TTS系统需要能产生更为自然的任意说话人的声音。虽然基于波形拼接的大语料库语音合成系统能够合成高可懂度和自然度的合成语音,但语音库的构建费时费力,而且难以实现不同说话人、不同情感的合成语音。基于HMM的统计参数语音合成系统虽然能够合成出不同说话人的语音,但合成语音的自然度不是很高。因此,一种利用说话人的少量训练语句合成出具有目标说话人特点的说话人自适应语音合成方法,成为当前一个重要的研究热点。论文以基于HMM统计参数语音合成为研究基础,采用说话人自适应训练,利用多个说话人的训练语音,实现了一个普通话的多说话人统计参数语音合成系统,能够合成出不同目标说话人语音,合成效果优于单说话人的说话人相关模型的合成结果。论文的主要研究工作及创新如下。
  1.根据《现代汉语词典》,从汉语发音的基本单元出发,对汉语声、韵母分类划分,分析了连续语句中语境相关的信息,并以此为基础设计了连续语句语境信息的标注方案。采用上下文相关的方法将语境信息从小到大分为六层,分别设计出各个层级的标注格式和标注内容,然后对语音信息及其上下文关系进行了标注设计,并实现了一个面向HTS系统的汉语普通话上下文相关的标注产生程序。
  2.根据汉语普通话的发音特点和韵律特点,实现了一个面向HTS系统的问题集生成程序,可以生成音段相关和韵律相关的问题,用于HTS系统中对模型状态的决策树聚类。
  3.利用说话人自适应训练方法实现了一个基于HMM的普通话多说话人语音合成系统。该系统利用多个说话人的训练语句获得一个平均音模型,并利用说话人自适应变换获得不同说话人的说话人相关模型。实验结果表明,本文提出的方法,其MOS得分和DMOS得分均优于仅使用一个说话人的训练语句训练的说话人相关模型的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号