基于模型聚类的说话人识别方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别是一种身份认证技术，可以通过计算机来自动实现。说话人识别由于其不仅方便、经济且准确性高，逐渐成为人们常用的身份验证方式，市场应用前景非常广阔。
　　识别正确率和鲁棒性一直都是说话人识别系统的研究重点，混合高斯模型(Gaussian Mixture Model，GMM)由于能很好地描述说话人特征分布情况，被广泛地应用于与文本无关的说话人识别中。随着识别系统语音库中的说话人数目的增多，传统GMM模型的识别时间越来越长，识别速度慢将大大限制说话人识别系统的实用性。本文提出基于模型聚类的说话人识别，在尽量不降低识别性能的情况下，大大提高识别速度。
　　在识别时，发现每次得分较高的说话人模型只有少数几个，因此只需将测试特征矢量与这少部分说话人模型进行匹配，就可确定说话人身份。说话人模型聚类就是利用说话人模型相似的特性，将相近的说话人模型聚类，聚类后为每一类选取类中心和类代表。测试时，首先计算测试特征矢量与类中心之间的欧氏距离或者与类代表之间的对数似然度，选定距离最小或者得分最高的一类，再计算测试特征矢量与选定类中说话人模型之间的对数似然度，最终确定目标说话人。由于可能出现聚类不完全的情况，在测试时选择得分较高的几类构成类的子集合，可以保证识别正确率。实验结果表明:相较于传统的GMM模型，基于模型聚类的说话人识别在聚类数目为100，测试搜索范围为20％时，识别正确率只降低了0.95％，但是平均识别速度却提高了近4倍。
　　为了进一步提高说话人识别系统的识别速度，本文又提出说话人模型聚类和预量化或剪枝相融合的算法。预量化或剪枝是对测试特征矢量进行处理来提高识别速度，属于测试阶段的提速方法;而说话人模型聚类是指在训练阶段结束后，将训练好的说话人模型聚类，属于训练阶段的加速方法。不同阶段的加速方法可以进行融合，进一步提升系统的识别速度。

著录项

作者
熊华乔;
展开▼
作者单位

武汉理工大学;

展开▼
授予单位武汉理工大学;
学科通信与信息系统
授予学位硕士
导师姓名郑建彬;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;模式识别与装置;
关键词
模型聚类; 说话人; 识别方法; 欧氏距离; 搜索范围;

相似文献

中文文献
外文文献
专利

1. 基于模型的聚类方法研究 [J] . 宋浩远 . 重庆科技学院学报（自然科学版） . 2008,第003期
2. 数据挖掘中基于模型的聚类分析方法研究 [J] . 张剑飞 ,王辉 . 克山师专学报 . 2004,第003期
3. 基于减法聚类与改进的模糊C-均值聚类算法的说话人识别方法的研究 [J] . 崔连延 ,徐林 ,顾树生 . 信息与控制 . 2008,第3期
4. 一种基于模型距离的改进的说话人识别技术 [J] . 孙林慧 ,杨震 . 西安邮电学院学报 . 2005,第002期
5. 基于聚类分析与说话人识别的语音跟踪 [J] . 郝敏 ,刘航 ,李扬 . 计算机与现代化 . 2020,第004期
6. 基于核K-均值聚类和支持向量机结合的说话人识别方法 [C] . 高争艳 ,王慕坤 . 第一届中国高校通信类院系学术研讨会 . 2007
7. 基于聚类分析和神经网络集成的说话人识别方法研究 [A] . 张雷 . 2013

基于模型聚类的说话人识别方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅