基于FDA的语音基频建模的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音是人类交流最为方便快捷的方式。随着人机对话技术的发展,人们对合成语音的质量要求越来越高。语音基频曲线对合成语音的自然度有决定性的作用,对语音基频包络的建模成为人机交互领域的一个重要研究课题。本文提出了一种利用FDA(FunctionalDataAnalysis,泛函数据分析)对语音基频包络建模的新方法,建立了汉语普通话和兰州方言单音节的四种不同声调的基频曲线的FDA模型,并利用建立的基频模型实现了普通话到兰州方言的转换。论文工作对于实现普通话和兰州方言的韵律建模、揭示普通话和兰州方言之间的联系与区别有重要的理论意义和应用价值。论文的主要工作如下:
　　1.提出了一种利用泛函数据分析FDA(functionaldataanalysis)对语音基频包络建模的新方法。用B-样条函数对语音的单字基频进行数据平滑处理,得到平滑后的基频曲线,将平滑后的基频曲线再进行两次时间校准处理,最后通过主成分和主微分分析,最终得到拟合后的基频曲线。将原始基频与拟合后的基频曲线进行对比分析,实验结果表明,本文提出的建立基频模型的方法,具有一定的可行性,可应用于语音合成等语音信息处理研究中。
　　2.建立了普通话和兰州话的FDA基频曲线模型。标注了普通话和兰州方言的4种声调的160个单音节的基频包络,用FDA方法对普通话和兰州话的四种声调的单字基频曲线建立了基频包络模型。论文对普通话和兰州方言的FDA基频模型拟合得到的基频曲线分别进行了误差分析,得到原始普通话基频与拟合后的普通话基频曲线间的均方根误差为6.47Hz,相应的兰州方言的FDA基频模型其均方根误差为3.88Hz。论文采用STRAIGHT算法,利用模型产生的基频包络重新合成普通话语音和方言语音,主观评测结果表明,普通话的MOS得分为4.17,兰州话的MOS得分为4.19分。实验验证了FDA基频模型的在基频建模上的适用性。
　　3.实现了普通话到兰州方言的转换。首先,通过输入的文本得到兰州方言的声调信息,同时利用输入的普通话语音文件用STRAIGHT方法得到四种声调对应的谱参数和基频包络,然后,利用已建立的兰州方言的FDA模型产生不同声调的兰州方言基频包络F0值,最后利用模型得到的兰州方言F0值和普通话的谱参数用STRAIGHT方法合成兰州方言。转换的语音的DMOS得分为3.88,表明基于FDA的基频建模方法能够应用于方言的语音转换中。

著录项

作者
王红丽;
展开▼
作者单位

西北师范大学;

展开▼
授予单位西北师范大学;
学科电路与系统
授予学位硕士
导师姓名杨鸿武;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;自动化系统理论;
关键词
泛函数据分析; 语音基频包络建模; B-样条函数; 人机对话技术;

相似文献

中文文献
外文文献
专利

1. 基于FDA的基频建模 [J] . 杨鸿武 ,王红丽 ,裴东 . 西北师范大学学报（自然科学版） . 2013,第002期
2. 基于非负矩阵分解的情感语音基频转换研究 [J] . 邓叶勋 ,赵晖 . 计算机工程 . 2018,第005期
3. 基于MATLAB语音信号基频估计方法研究 [J] . 王静 . 微计算机信息 . 2007,第03S期
4. 基于MATLAB语音信号基频估计方法研究 [J] . 王静 . 微计算机信息 . 2007,第007期
5. 基于基频特征的情感语音识别研究 [J] . 郭鹏娟 ,蒋冬梅 ,Hichem Sahli . 计算机应用研究 . 2007,第010期
6. 基于关联规则的情感语音合成中韵律参数基频研究 [C] . Jinghua Wang ,王敬华 ,Jianyin Liu . 2012全国无线及移动通信学术大会 . 2012
7. 统计参数语音合成中的基频建模与生成方法研究 [A] . 高丽 . 2015

基于FDA的语音基频建模的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅