说话人识别算法研究与说话人辨认系统实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别是最自然的生物特征身份鉴定方式,可分为说话人辨认和说话人确认。说话人识别根据包含在语音信号中的个性特征来自动识别说话人,其关键问题是特征参数选择与识别模型建立。目前,说话人识别的常用特征参数有线性预测编码(LPC)参数、LPC倒谱(LPCC)和美尔倒谱系数(MFCC)等,常用的识别模型有动态时间规整(DTW)、矢量量化(VQ)、隐马尔可夫模型(HMM)等。LPCC反映了说话人声道生理结构的差异,而MFCC则利用了听觉频率非线性特性,反映了人对语音的感知特性。希尔伯特-黄变换(HHT)自1998年提出,由于其处理时变、非稳态系统信号的较强的自适应能力,已得到了较广泛的关注和获得了许多成功的应用,目前也是语音信号处理的最新研究手段。这些特征参数各有其优势,但单独都不能充分描述说话人的个性特征,一般主要包含语义信息,也可能包含说话人的某些特征,综合利用方可使系统性能可靠。有鉴于此,在说话人识别系统中首先分别使用LPCC、MFCC和HHT提取出的参数作为特征参数,然后将MFCC与基于HHT提取出的特征参数有机地构成混合参数。本文采用Matlab工具试验比较了LPCC、MFCC、基于HHT提取出的特征参数、混合参数分别与DTW、DHMM(离散马尔可夫模型)、GMM(高斯混合模型)相结合的识别效果。接着,测试了GMM中高斯分量的选择对识别性能的影响。实验结果显示,对于说话人辨认,基于HHT提取出的特征参数有较好的识别率,基于混合参数和GMM相结合的识别率高于基于混合参数和DTW或DHMM相结合的识别率,并且混合参数明显优于单一的参数的性能。试验证明了基于HHT提取出的特征参数作为一种新的特征参数可以应用于说话人识别,将其与MFCC参数相结合构成混合参数,既利用MFCC能够较好地描述动态时间序列又利用HHT频率分辨能力强的特点,将该混合参数应用于说话人辨认系统,提高了系统的性能。对于说话人辨认系统,识别模型选择GMM,系统的识别性能是最优的,即识别率最好,训练时间较短。

著录项

作者
杨善茜;
展开▼
作者单位

广西师范大学;

展开▼
授予单位广西师范大学;
学科计算机应用技术
授予学位硕士
导师姓名黄汉明;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
说话人辨认; 隐马尔可夫模型(HMM ); 希尔伯特黄变换(HHT ); 美尔倒谱系数(MFCC);

相似文献

中文文献
外文文献
专利

1. 说话人识别算法研究及其在SOC上的实现 [J] . 侯焱 ,张高伟 ,姜红超 . 微计算机信息 . 2006,第032期
2. 说话人识别算法研究及其在SOC上的实现 [J] . 侯焱 ,张高伟 ,姜红超 . 微计算机信息 . 2006,第11Z期
3. 基于VQ反模仿说话人识别再确认系统算法研究 [J] . 周鸣 ,景新幸 . 大众科技 . 2008,第003期
4. 基于矢量量化的说话人识别系统硬件实现 [J] . 何赞园 ,王凯 ,吉立新 . 现代电子技术 . 2022,第1期
5. 基于GMM的说话人识别系统研究及其MATLAB实现 [J] . 何建军 . 软件导刊 . 2021,第008期
6. 一种改进的GMM实时说话人辨认系统的设计与实现 [C] . 蒋晔 ,唐振民 . 2009年全国模式识别学术会议暨首届中日韩模式识别学术研讨会 . 2009
7. 说话人识别算法研究及其在安卓平台的实现 [A] . 魏啸天 . 2017

说话人识别算法研究与说话人辨认系统实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅