首页> 中文学位 >汉语普通话声调评测算法研究
【6h】

汉语普通话声调评测算法研究

代理获取

目录

声明

摘要

第一章 引言

1.1 语音评测技术的研究意义及现状

1.2 声调评测技术的研究意义及现状

1.3 课题研究内容及论文结构安排

第二章 语音声学模型及连续语音的切分

2.1 声调测评系统基本结构

2.2 HMM模型

2.2.1 HMM的基本元素和基本问题

2.2.2 前向-后向算法

2.2.3 维特比算法

2.2.3 HMM参量训练的Baum-Welch算法

2.3 连续语音的自动切分

2.4 隐马尔科夫模型工具箱HTK介绍

第三章 汉语声调特征及基音提取

3.1 汉语连续语音中声调的特征

3.2 基音提取

3.2.1 自相关法提取基音频率

3.2.2 RAPT提取基音频率

3.3 基音检测实验结果分析

3.4 小结

第四章 连续语音声调评测算法

4.1 算法性能评价

4.2 声调的后验概率得分及映射算法

4.3 声调特征提取

4.3.1 子段声调特征

4.3.2 声调特征的插值改进

4.3.3 声调特征的Fujisaki模型改进

4.3.4 Fujisaki模型下声调的核心段和转移段特征

4.4 实验及结果分析

4.4.1 语料库

4.4.2 实验结果与分析

4.5 小结

第五章 总结与展望

参考文献

攻读学位期间公开发表的论文

致谢

展开▼

摘要

声调在汉语中有着构词辨义的作用,声调的准确程度足判定普通话好坏的重要因素之一。因此,声调评测子系统也是计算机辅助语言学习(CALL)系统以及普通话水平测试(PSC)系统的重要组成部分。在连续语流中,因为当前音节受上下文内容的影响,所以声调中存在着不可忽视的变调和连续现象,对这种现象是否处理以及如何处理将对声调评测系统的性能产生很人的影响。本文考虑连续语音基频曲线中存在的各种超音段信息,对传统三音节声调轮廓特征的GMM模型进行特征的改进,以提高评测算法打分的准确度。本文主要研究成果如下。
   1.基频曲线的求取:传统基频曲线FO的求取,只得到了单个音节的基音频率,却忽略连续语流中两个音节之间声调的转换信息。本文考虑音节中辅音的基音频率可以代表前一音节与当前音节的声调转移特征,对三音节中的清辅音部分用Spline插值法来拟合转移的声调曲线。实验表明,基于曲线插值拟合的GMM模型评测方法可以使测试集的机器打分和人工打分相关性可以达到0.7309。
   2.声调特征的选择:Fujisaki模型将基频曲线拆解成三个不同的元件函数,它们分别为短语元件:代表语句的语调信息:强调元件:反映每个音节的音调走势,即为声调信息:基底频率:代表了说话人的个性信息。根据上述理论,本文在Fujisaki模型的基础上去除语句的语调和说话人个性特征,只对基频曲线中的声调特征建模,结果显示,改进特征相比于传统特征,打分相似度在测试集中提高了14.09%。
   3.声调模型的改进:在验证声调转移特征对评测相关度的促进作用中,本文在Fujisaki模型的基础上分别对声调的核心段和特征转移段进行建模,实验结果表明基于频率转移特征的打分相关度比纯粹核心段特征的打分相关度要高。并且相较于2中Fujisaki模型在打分测试集中的相关度0.7361,基于声调核心段的评测相关度只有0.6137。这也说明了音节之fHJ频率转移信息的描述提高了声调评测的准确度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号