首页> 中文学位 >基于FDA的语音基频建模的研究
【6h】

基于FDA的语音基频建模的研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 研究背景

1.2 语音基频模型分析

1.3 语音基频模型研究现状

1.4 研究意义

1.5 论文的结构

1.6 本章小结

第2章 FDA的基本概念和方法

2.1 FDA基本概念

2.2 FDA技术发展历史及现状

2.3 FDA泛函数据的性能

2.4 基函数的产生

2.5 B-样条基函数(B-spline basis)

2.6 粗糙度惩罚

2.7 本章小结

第3章 基于FDA的基频建模

3.1 FDA方法的基本原理

3.2 用FDA方法对基频曲线建模

3.3 用FDA方法进行基频建模优点

3.4 本章小结

第4章 不同声调单音节的基频建模

4.1 单音节数据处理

4.2 不同声调单字音节基频模型的实现

4.3 本章小结

第5章 基于FDA的兰州方言的基频曲线建模

5.1 兰州方言的特点

5.2 关键点对基频曲线的影响

5.3 FDA基频模型对两种语言的对比

5.4 本章小结

第6章 基于FDA基频建模的应用

6.1 语音合成技术

6.2 实验设计

6.3 Straight修改方法

6.4 基频曲线参数提取

6.5 模型结果的主观评测

6.6 本章小结

第7章 总结与展望

参考文献

攻读学位期间所发表的论文与主要成果

致谢

展开▼

摘要

语音是人类交流最为方便快捷的方式。随着人机对话技术的发展,人们对合成语音的质量要求越来越高。语音基频曲线对合成语音的自然度有决定性的作用,对语音基频包络的建模成为人机交互领域的一个重要研究课题。本文提出了一种利用FDA(FunctionalDataAnalysis,泛函数据分析)对语音基频包络建模的新方法,建立了汉语普通话和兰州方言单音节的四种不同声调的基频曲线的FDA模型,并利用建立的基频模型实现了普通话到兰州方言的转换。论文工作对于实现普通话和兰州方言的韵律建模、揭示普通话和兰州方言之间的联系与区别有重要的理论意义和应用价值。论文的主要工作如下:
  1.提出了一种利用泛函数据分析FDA(functionaldataanalysis)对语音基频包络建模的新方法。用B-样条函数对语音的单字基频进行数据平滑处理,得到平滑后的基频曲线,将平滑后的基频曲线再进行两次时间校准处理,最后通过主成分和主微分分析,最终得到拟合后的基频曲线。将原始基频与拟合后的基频曲线进行对比分析,实验结果表明,本文提出的建立基频模型的方法,具有一定的可行性,可应用于语音合成等语音信息处理研究中。
  2.建立了普通话和兰州话的FDA基频曲线模型。标注了普通话和兰州方言的4种声调的160个单音节的基频包络,用FDA方法对普通话和兰州话的四种声调的单字基频曲线建立了基频包络模型。论文对普通话和兰州方言的FDA基频模型拟合得到的基频曲线分别进行了误差分析,得到原始普通话基频与拟合后的普通话基频曲线间的均方根误差为6.47Hz,相应的兰州方言的FDA基频模型其均方根误差为3.88Hz。论文采用STRAIGHT算法,利用模型产生的基频包络重新合成普通话语音和方言语音,主观评测结果表明,普通话的MOS得分为4.17,兰州话的MOS得分为4.19分。实验验证了FDA基频模型的在基频建模上的适用性。
  3.实现了普通话到兰州方言的转换。首先,通过输入的文本得到兰州方言的声调信息,同时利用输入的普通话语音文件用STRAIGHT方法得到四种声调对应的谱参数和基频包络,然后,利用已建立的兰州方言的FDA模型产生不同声调的兰州方言基频包络F0值,最后利用模型得到的兰州方言F0值和普通话的谱参数用STRAIGHT方法合成兰州方言。转换的语音的DMOS得分为3.88,表明基于FDA的基频建模方法能够应用于方言的语音转换中。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号