声明
摘要
第一章 绪论
1.1 课题研究的背景及意义
1.2 国内外发展现状
1.3 说话人识别的研究难点
1.4 论文主要内容及结构
第二章 说话人识别系统概述
2.1 说话人识别的概述
2.1.1 说话人识别的基本原理
2.1.2 说话人识别的分类
2.2 说话人识别的特征提取
2.2.1 Mel频率倒谱系数MFCC
2.2.2 线性预测系数LPC
2.2.3 线性预测倒谱系数LPCC
2.3 说话人识别主要方法
2.3.1 模板匹配法
2.3.2 概率统计方法
2.3.3 人工神经网络方法
2.3.4 支持向量机方法
2.4 本章小结
第三章 基于平滑幅度谱包络的MFCC特征提取
3.1 MFCC特征提取
3.2 基于平滑幅度谱包络的MFCC特征提取
3.2.1 基音频率对MFCC参数的影响
3.2.2 基于平滑幅度谱包络的MFCC特征提取的实现
3.3 实验
3.3.1 试验中所用语音库介绍
3.3.2 实验结果与分析
3.4 本章小结
第四章 基于多窗频谱估计和平滑幅度谱包络的MFCC
4.1 多窗频谱估计
4.1.1 Multipeak
4.1.2 SWCE
4.1.3 Thomson
4.2 基于Multitapering的MFCC特征提取
4.3 基于多窗频谱估计和平滑幅度谱包络的MFCC
4.4 实验与分析
4.4.1 窗个数对多窗频谱估计的影响
4.4.2 实验结果与分析
4.4 本章小结
第五章 基于有效融合的说话人识别系统
5.1 △MFCC
5.2 IMFCC和MidMFCC
5.3 Fisher比准则
5.4 实验与分析
5.4.1 MFCC与△MFCC融合
5.4.2 MFCC、IMFCC和MidMFCC的融合
5.4.3 新的混合特征参数的提取
5.5 本章小结
第六章 总结与展望
6.1 工作总结
6.2 研究展望
参考文献
致谢
攻读硕士期间发表的学术论文和参加科研情况