声明
摘要
第一章 绪论
1.1 研究背景及意义
1.2 发展历史及现状
1.3 语音识别框架
1.3.1 特征提取
1.3.2 声学模型
1.3.3 语言模型
1.3.4 解码器
1.4 说话人自适应技术
1.5 系统的评价指标
1.6 本文主要研究内容及结构安排
第二章 基于辅助特征的说话人自适应方法
2.1 引言
2.2 HMM-DNN声学建模
2.3 基于辅助特征的说话人自适应模型
2.4 鉴别性矢量
2.4.1 全局差异空间矩阵的估计
2.4.2 鉴别性矢量的提取
2.5 瓶颈说话人矢量
2.5.1 瓶颈特征
2.5.2 瓶颈说话人矢量的提取
2.6 最大似然线性回归
2.6.1 无约束最大似然线性回归
2.6.2 约束最大似然线性回归
2.7 实验结果与分析
2.7.1 实验语料库及环境配置
2.7.2 基线系统
2.7.3 结果与分析
2.8 本章小结
第三章 基于LHUC的说话人自适应方法
3.1 引言
3.2 LHUC自适应方法
3.2.1 LHUC基本原理
3.2.2 自适应参数更新
3.3 基于多任务学习的说话人自适应方法
3.3.1 多任务学习基本原理
3.3.2 多任务学习的LHUC自适应系统
3.4 实验结果与分析
3.4.1 实验配置
3.4.2 结果与分析
3.5 本章小结
第四章 基于卷积神经网络的说话人自适应方法
4.1 引言
4.2 卷积神经网络模型
4.2.1 卷积层
4.2.2 池化层
4.2.3 全连接层
4.3 基于CNN的说话人自适应建模
4.3.2 CNN-LHUC自适应方法
4.3.3 基于i-vector的CNN自适应方法
4.4 实验结果与分析
4.4.1 实验配置
4.4.2 结果与分析
4.5 本章小结
第五章 总结与展望
5.1 论文工作总结
5.2 研究工作展望
参考文献
致谢
在读期间发表的学术论文与取得的其他研究成果