首页> 中文学位 >说话人识别算法研究及其在安卓平台的实现
【6h】

说话人识别算法研究及其在安卓平台的实现

代理获取

目录

第一章 绪论

1.1 课题背景及研究意义

1.2 国内外研究现状

1.3 说话人识别技术简介

1.4 本文的组织结构和主要研究内容

1.5 本章小节

第二章 说话人识别技术

2.1 说话人识别系统的结构

2.2 语音信号产生的机理

2.3 语音信号的预处理

2.4 语音信号的分析方法

2.5 语音信号的端点检测

2.6 语音信号的特征提取

2.7 说话人识别系统性能评价

2.8 本章小结

第三章 基于VQ的说话人识别系统研究与实现

3.1 基于VQ的说话人识别系统结构

3.2 矢量量化介绍

3.3 系统仿真实现

3.4 实验结果分析

第四章 基于GMM的说话人识别系统的研究和实现

4.1 基于GMM的说话人识别系统的结构

4.2 高斯混合模型介绍

4.3 系统仿真实现

4.4 实验结果分析

4.5 本章小结

第五章 Android平台说话人识别系统的实现

5.1 Android系统简介

5.2 Android平台架构及开发环境搭建

5.3 说话人识别系统在Android平台上的实现

5.4 实验结果分析

5.5 本章小结

总结与展望

参考文献

攻读学位期间发表的论文

声明

致谢

展开▼

摘要

说话人识别技术,也称为声纹识别技术,是根据说话人之间的不同发音和行为特征来鉴别说话人身份的一种生物识别方案,它具有采集简单、使用方便的优点。随着移动互联网技术和智能移动终端的飞速发展,移动手持终端设备已经渗透到现实生活的方方面面,极大的方便了人们的生活、工作和学习。越来越多的移动应用纳入声纹识别、语音识别技术并发布在移动平台的应用商店里,如Android平台应用商店的声纹解锁、科大讯飞的灵犀语音助手等。
  本文从语音信号的产生原理入手,介绍了说话人识别系统的基本结构和说话人个性特征参数的提取流程,包括了预加重、加窗分帧和端点检测,详细地归纳了常见的说话人个性特征参数LPC、LPCC和MFCC的提取方法。研究了基于VQ的说话人识别系统和GMM说话人识别系统并在Matlab上进行实验仿真,最后在移动智能手机市场占有率最高的Android系统上实现了基于VQ的说话人识别系统。本文的主要研究内容如下:
  (1)针对传统短时能量和平均过零率在低信躁比环境下鲁棒性较差,本文提出了一种结合短时能量和分形维数的端点检测方法。
  (2)深入研究了基于VQ的说话人识别系统,详细阐述了VQ基本原理和LBG算法。以CoolEdit录制的小型语音库,在Matlab搭建了基于VQ的说话人识别系统,并通过该系统论证不同的码本尺寸、训练或识别语音样本的时长和特征参数的维数对系统识别性能的影响。
  (3)以高斯混合模型作为说话人模型,使用K均值聚类算法初始化GMM参数。以TIMIT语音库,在Matlab上搭建了基于GMM的说话人识别系统并通过与用户友好交互的界面,论证了不同的GMM阶数、训练或识别语音样本的时长、特征参数、协方差阈值和语音帧长对系统识别性能的影响。
  (4)在Android平台上实现了基于VQ的说话人识别系统,然后简要介绍了该系统结构和各模块的实现方法,通过实验验证在低信躁环境下本文提出的结合短时能量和分形维数的端点检测方法优于传统基于短时能量和平均过零率的端点检测方法。
  本文最后对未来的研究工作进行了展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号