说话人识别算法研究及其在安卓平台的实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

说话人识别技术，也称为声纹识别技术，是根据说话人之间的不同发音和行为特征来鉴别说话人身份的一种生物识别方案，它具有采集简单、使用方便的优点。随着移动互联网技术和智能移动终端的飞速发展，移动手持终端设备已经渗透到现实生活的方方面面，极大的方便了人们的生活、工作和学习。越来越多的移动应用纳入声纹识别、语音识别技术并发布在移动平台的应用商店里，如Android平台应用商店的声纹解锁、科大讯飞的灵犀语音助手等。
　　本文从语音信号的产生原理入手，介绍了说话人识别系统的基本结构和说话人个性特征参数的提取流程，包括了预加重、加窗分帧和端点检测，详细地归纳了常见的说话人个性特征参数LPC、LPCC和MFCC的提取方法。研究了基于VQ的说话人识别系统和GMM说话人识别系统并在Matlab上进行实验仿真，最后在移动智能手机市场占有率最高的Android系统上实现了基于VQ的说话人识别系统。本文的主要研究内容如下：
　　（1）针对传统短时能量和平均过零率在低信躁比环境下鲁棒性较差，本文提出了一种结合短时能量和分形维数的端点检测方法。
　　（2）深入研究了基于VQ的说话人识别系统，详细阐述了VQ基本原理和LBG算法。以CoolEdit录制的小型语音库，在Matlab搭建了基于VQ的说话人识别系统，并通过该系统论证不同的码本尺寸、训练或识别语音样本的时长和特征参数的维数对系统识别性能的影响。
　　（3）以高斯混合模型作为说话人模型，使用K均值聚类算法初始化GMM参数。以TIMIT语音库，在Matlab上搭建了基于GMM的说话人识别系统并通过与用户友好交互的界面，论证了不同的GMM阶数、训练或识别语音样本的时长、特征参数、协方差阈值和语音帧长对系统识别性能的影响。
　　（4）在Android平台上实现了基于VQ的说话人识别系统，然后简要介绍了该系统结构和各模块的实现方法，通过实验验证在低信躁环境下本文提出的结合短时能量和分形维数的端点检测方法优于传统基于短时能量和平均过零率的端点检测方法。
　　本文最后对未来的研究工作进行了展望。

著录项

作者
魏啸天;
展开▼
作者单位

广东工业大学;

展开▼
授予单位广东工业大学;
学科控制工程
授予学位硕士
导师姓名鲍鸿,张晶,张义平;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;蜂窝式移动通信系统（大哥大、移动电话手机）;
关键词
说话人识别; 分形维数; 矢量量化; 高斯混合模型; 安卓系统; 智能手机;

相似文献

中文文献
外文文献
专利

1. 说话人识别算法研究及其在SOC上的实现 [J] . 侯焱 ,张高伟 ,姜红超 . 微计算机信息 . 2006,第032期
2. 说话人识别算法研究及其在SOC上的实现 [J] . 侯焱 ,张高伟 ,姜红超 . 微计算机信息 . 2006,第11Z期
3. 基于Gammatone滤波器组的说话人识别算法研究 [J] . 茅正冲 ,王正创 ,王丹 . 计算机工程与应用 . 2015,第001期
4. 一种低信噪比下的说话人识别算法研究 [J] . 茅正冲 ,王正创 ,龚熙 . 计算机应用与软件 . 2014,第012期
5. 改进i-向量说话人识别算法研究 [J] . 邢玉娟 ,潘颖 ,曹晓丽 . 科学技术与工程 . 2014,第034期
6. 安卓平台IETM产品发布系统研究与实现 [C] . 刘建 ,王金鑫 ,张贝贝 . 第二十五届测试与故障诊断技术研讨会 . 2016
7. 基于GMM的说话人识别算法研究及其在安卓平台的实现 [A] . 何建军 . 2012

说话人识别算法研究及其在安卓平台的实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅