首页> 中文学位 >基于HTK的计算机辅助田野调查系统研究
【6h】

基于HTK的计算机辅助田野调查系统研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第一章绪论

1.1研究背景及意义

1.2研究目的

1.3研究现状

1.4论文主要工作

第二章元辅音的声学特征

2.1元音与辅音的发音原理

2.2 元音与辅音的声学特征及切分

2.3基于语音识别的声学特征参数提取

2.3小结

第三章基于HMM的语音识别系统

3.1隐马尔柯夫模型

3. 2 HTK语音识别工具包

3.3 H T K语音识别流程

3.4小结

第四章单音节的语料声韵识别实验

4.1实验数据准备和预处理

4.2 针对特定人的语音识别实验

4.3 针对非特定人的语音识别实验

4.4小结

第五章总结与展望

5.1工作总结与创新点

5.2 研究展望

参考文献

致谢

声明

展开▼

摘要

中国是个多民族、多语种的国家,语言研究面临十分繁重的任务。近些年越来越多的计算机软件开发用于语言的田野调查,大大提高了调查的效率。然而在计算机软件在完成录音工作后,记音和校对环节还停留在人工听辨的阶段。由于田野调查语料数量庞大,记音工作繁重,难以保持标准的一致,从而产生人为原因的谬误,且目前尚无更加有效的办法缩减记音的工作量。本文针对这个问题进行了基于HTK的单音节识别研究,通过对现有田野调查语料的单音节录音文件进行特征分析、预处理、提取MFCC特征参数,从而建立每个音对应的HMM模型,利用HTK工具包对语音特征进行提取,从而实现语音声学模型的训练,最后进行识别性能测试。本文对田野调查的语料进行了收集和预处理,合并了不同语言中的相同发音,并且针对MFCC维数、HMM状态数及GMM个数这三个参数对跨语言的混合材料中单音节的识别率进行研究。实验表明:对于包含了方言和民族语多种语言混合的单音节语音材料,在单个用于训练的独立语音数据量充足的情况下,识别率可以达到80%左右。并且增加HMM状态数和GMM个数有利于识别率的提高,但是超过一定的值后,识别率会有所下降。对于非特定人的单音识别来说,单个语音的识别率和其训练量成正比。在语音数据量充足的情况下,能得到较为理想的识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号