声明
摘要
表格索引
插图索引
第一章 绪论
1.1 声音转换概述
1.1.1 声音转换技术
1.1.2 研究意义和应用价值
1.2 声音转换研究现状分析
1.3 论文研究目标和研究内容
1.4 论文结构安排
第二章 声音转换关键技术
2.1 声音转换的语音学基础
2.1.1 语音的发音机理
2.1.2 语音中说话人相关特征
2.2 语音分析/合成器
2.3 特征提取
2.4 特征序列对齐
2.5 特征转换
2.5.1 韵律特征转换
2.5.2 频谱特征转换
2.6 基于高斯混合模型的频谱特征转换方法
2.6.1 算法原理
2.6.2 过平滑效应问题分析
2.7 基于神经网络的频谱特征转换方法
2.7.1 传统建模方法
2.7.2 研究新进展
2.7.3 建模特点分析
2.8 转换语音效果评价方法
2.8.1 客观评价方法
2.8.2 主观评价方法
2.9 本章小结
第三章 基于双向联想贮存器的频谱包络联合特征建模方法
3.1 双向联想贮存器模型简介
3.2 基于双向联想贮存器的频谱包络联合特征建模
3.2.1 基本原理
3.2.2 参数估计
3.2.3 系统搭建
3.2.4 实验条件
3.2.5 实验结果
3.3 本章小结
第四章 基于逐层产生式训练的深度神经网络的频谱包络转换方法
4.1 基于逐层产生式训练的深度神经网络的频谱包络转换方法原理
4.2 实验条件
4.3 实验结果与分析
4.3.1 RBM和GBAM建模能力分析
4.3.2 与FTDNN的转换效果对比
4.3.3 GTDNN模型的频谱包络转换效果分析
4.3.4 与GMM-GV系统转换效果对比
4.4 本章小结
第五章 基于多源说话人数据训练的深度神经网络的频谱转换方法
5.1 模型原理
5.1.1 单目标深度神经网络训练原理
5.1.2 多目标深度神经网络训练原理
5.2 实验条件
5.3 实验结果与分析
5.3.1 作为源说话人无关模型转换效果分析
5.3.2 作为DNN初始化模型性能
5.4 本章小结
第六章 总结与展望
参考文献
致谢
在读期间发表的学术论文与取得的研究成果