基于HMM和小波的中英文语音的自动切分研究和实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文广泛深入地研究、分析了当前国内外各种语音切分方法，并对各种方法的切分准确率进行了分析、比较。在此基础上，将小波理论和语音分析相结合，提出了基于小波包变换的语音特征参数用于语音的自动切分；在实现自动切分过程中，运用基于隐马尔可夫模型(HMM) 的基本理论和算法，完成了HMM的建模、训练和切分；并对可能遇到的各种实际问题，提出了相应的解决方法；最终实现了基于隐马尔可夫模型 (HMM) 的语音自动切分系统。通过各种实验比较，给出了优化的模型配置，使切分性能得到明显的提高。本论文的主要贡献和创新为以下几点：1、提出了基于小波包分解的语音特征参数用于语音的自动切分。将小波理论与语音感知特性相结合，运用小波包变换对语音进行变换，再按照类似于语音感知频带划分来选取小波子带，这种划分与人耳的临界频带相似，从而建立了基于小波包分解的语音特征参数WPP(Wavelet Packet Parameters)。实验证明WPP优于传统的语音特征参数 MFCC(Mel Frequency Cepstrum Coefficients)，使得语音切分的准确性得到了提高。2、将RASTA滤波器用于改进语音参数。在对基于小波包分解的语音特征参数 WPP 的求解过程中添加了 RASTA(RelativeSpectral)滤波器，对每个子带的能量谱进行滤波后，通过滤波后获得的语音参数用于语音自动切分。RASTA 滤波处理是用一个低端截止频率很低的带通滤波器对语音信号进行滤波处理。经过处理后，频谱中的常量或者变化缓慢的部分被抑制，动态成分被增强。通过 RASTA滤波来增强小波子带参数的动态特性，实验证明改进的语音参数提高了语音切分的准确率。3、通过主成份分析(PCA)方法获得时间过滤器用于改进语音参数。采用主成份分析(Principal Component Analysis，PCA)方法获得时间过滤器(Temporalfilter)，这种滤波器有着和RASTA滤波器相同的特性，增强了小波子带参数的动态成分。通过详细的比较分析，已证实通过主成份分析(PCA)方法获得时间过滤器对语音参数的改进可以提高语音切分的准确性。4、采取有标记初始化的方法来初始化HMM的模型。HMM模型初始化的好坏直接影响HMM模型的训练和最终的切分结果。我们比较了有标记和无标记的HMM模型初始化，发现通过有标记初始化的HMM模型的语音切分结果的准确性明显高于无标记初始化的HMM模型的语音切分结果。我们分析了语音初始化实验结果，可以看出在连续语流中选取语音样本用作HMM模型初始化训练切分，比参考种子字从语料中提取典型单音数据作为初始化样本来训练切分的准确性要高。因此，我们在语音切分中都采取从连续语流中选取语音作为HMM模型初始化训练样本的方法。5、根据所建立的语音库语音特点和差异，对中英文语音模型进行了修正和优化。每种语言语音库都有各自的特点，而且不同人朗读的语音也是有差异的，这些特点和差异直接影响到模型的建立和选取。所以需要根据不同的语音发音特点和朗读差异，对模型进行了修正和优化。在英文中我们对辅音连缀 dr,dr,dz，ts分别建立了模型，这些辅音连缀在发音过程中出现了比较明显的协同发音，与单独发音的t、r、z、s有着明显的不同，并根据英文发音中的失爆现象对词内的两个爆破音相连的第一个爆破音另建失爆模型；同时我们对中文中y，w相关的声韵模型进行了合并优化，因为在实际发音中y和w都存在不发音的现象。通过模型的修正和优化，使得语音切分的准确性得到了提高。6、提出了一种静音自动鉴别和处理的方法，以提高语音切分的正确性。在通过录音建立语音语料库的过程中，经常会出现一些停顿和呼吸，我们将这些能量很小的静音段、噪音和呼吸声统称为静音。而这些静音如果未标注在所对应的文本之中，这将直接影响到语音自动切分的准确性。因此，需要将这些静音以约定的标记(sil)添加到文本中。本文提出了一种静音自动鉴别和处理的方法，在经过语音粗切分后，通过规则设定、短时能量、短时过零率和算法修正几个步骤，将静音寻找出来，从而提高了语音切分的准确性。关键词：小波包变换，语音感知，RASTA，主成分分析，隐马尔可夫模型，自动切分，静音

著录项

作者
陈锴;
展开▼
作者单位

同济大学;

同济大学电子与信息工程学院;

展开▼
授予单位同济大学;同济大学电子与信息工程学院;
学科模式识别与智能系统
授予学位博士
导师姓名柴佩琪;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
小波包变换; 中英文; 语音切分; 隐马尔可夫模型; 初始化; 语音特征参数; 准确性; 语音参数; 滤波器; 静音; 主成份分析; 发音; 标记; Cepstrum Coefficients; 训练; 小波包分解; 过滤器; 语音感知; 修正; 小波理论;

相似文献

中文文献
外文文献
专利

1. 基于HMM连接语音自动切分中的初始化模型研究 [J] . 祝瑶卿 ,柴佩琪 . 微型电脑应用 . 2003,第007期
2. 基于HMM模型的语音单元边界的自动切分 [J] . 王丽娟 ,曹志刚 . 数据采集与处理 . 2005,第004期
3. 基于HMM的中文语音自动切分中的静音添加 [J] . 陈锴 ,柴佩琪 . 计算机工程 . 2004,第009期
4. 基于HMM的中英文语音合成技术研究 [J] . 纪正飚 ,王吉林 ,赵力 . 科学技术与工程 . 2014,第032期
5. 基于小波子带分解的特征参数对语音自动切分的改进 [J] . 秦欢 ,柴佩琪 ,陈锴 . 计算机应用 . 2005,第006期
6. 基于HMM和小波网络模型的抗噪语音识别方法 [C] . 林遂芳 ,潘永湘 ,孙旭霞 . 2005中国控制与决策学术年会 . 2005
7. 基于HMM与小波神经网络的语音识别系统研究 [A] . 唐军 . 2007

基于HMM和小波的中英文语音的自动切分研究和实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅