首页> 中文学位 >基于模型聚类的说话人识别方法研究
【6h】

基于模型聚类的说话人识别方法研究

代理获取

目录

声明

第1章 引言

1.1 说话人识别方法的研究背景

1.1.1 说话人识别的研究意义

1.1.2 说话人识别的发展

1.2 说话人识别原理

1.3 说话人识别面临的问题

1.4 论文的研究内容和结构

第2章 说话人识别方法

2.1 说话人识别的整体流程

2.2 高斯混合模型

2.2.1 高斯混合模型原理

2.2.2 高斯混合模型的建立

2.2.3 高斯混合模型的实验对比

2.3 小结

第3章 基于模型聚类的说话人识别

3.1 说话人模型聚类

3.1.1 说话人模型聚类方法

3.1.2 说话人模型聚类的设计过程

3.1.3 说话人模型聚类的识别阶段

3.1.4 说话人模型聚类的识别阶段效率分析

3.2 不同快速说话人识别方法的融合

3.3 小结

第4章 快速说话人识别实验结果分析

4.1 不同说话人识别方法的性能分析

4.1.1 基于模型聚类的说话人识别的性能分析

4.1.2 基于预量化的说话人识别性能分析

4.1.3 基于剪枝的说话人识别性能分析

4.1.4 不同快速识别方法融合的性能分析

4.2 实验结果对比分析

4.3 小结

第5章 总结与展望

5.1 全文总结

5.2 研究展望

致谢

参考文献

攻读硕士学位期间发表的学术论文

展开▼

摘要

说话人识别是一种身份认证技术,可以通过计算机来自动实现。说话人识别由于其不仅方便、经济且准确性高,逐渐成为人们常用的身份验证方式,市场应用前景非常广阔。
   识别正确率和鲁棒性一直都是说话人识别系统的研究重点,混合高斯模型(Gaussian Mixture Model,GMM)由于能很好地描述说话人特征分布情况,被广泛地应用于与文本无关的说话人识别中。随着识别系统语音库中的说话人数目的增多,传统GMM模型的识别时间越来越长,识别速度慢将大大限制说话人识别系统的实用性。本文提出基于模型聚类的说话人识别,在尽量不降低识别性能的情况下,大大提高识别速度。
   在识别时,发现每次得分较高的说话人模型只有少数几个,因此只需将测试特征矢量与这少部分说话人模型进行匹配,就可确定说话人身份。说话人模型聚类就是利用说话人模型相似的特性,将相近的说话人模型聚类,聚类后为每一类选取类中心和类代表。测试时,首先计算测试特征矢量与类中心之间的欧氏距离或者与类代表之间的对数似然度,选定距离最小或者得分最高的一类,再计算测试特征矢量与选定类中说话人模型之间的对数似然度,最终确定目标说话人。由于可能出现聚类不完全的情况,在测试时选择得分较高的几类构成类的子集合,可以保证识别正确率。实验结果表明:相较于传统的GMM模型,基于模型聚类的说话人识别在聚类数目为100,测试搜索范围为20%时,识别正确率只降低了0.95%,但是平均识别速度却提高了近4倍。
   为了进一步提高说话人识别系统的识别速度,本文又提出说话人模型聚类和预量化或剪枝相融合的算法。预量化或剪枝是对测试特征矢量进行处理来提高识别速度,属于测试阶段的提速方法;而说话人模型聚类是指在训练阶段结束后,将训练好的说话人模型聚类,属于训练阶段的加速方法。不同阶段的加速方法可以进行融合,进一步提升系统的识别速度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号