基于语种对抗训练的跨语种说话人识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，随着科技的高速发展，人们越来越多的关注到生活中的信息安全和身份认证，个人信息、保密信息的泄漏不但对个人的人身、财产安全造成严重威胁，也会对社会的发展带来不利的影响。目前，身份证件、口令密码等传统的身份认证和鉴别的方法已经不能完全满足人们的需求，而基于生物特征的身份鉴别技术以其方便、可靠等特性，越来越多的得到了人们的关注。语音作为人们日常生活中交流沟通最直接、最便捷的方式，其中衍生出的说话人识别技术也成为研究的热点和重点随着国际化浪潮的推进，单一的语言已经完全不能满足人们的日常生活、工作和学习的需要。我国幅员辽阔，是一个多民族融合的国家，有着丰富的少数民族语言和地区方言，这种情况在我国南部和西部的粤语、藏语、维语等与中文普通话差异较大的方言和民族语言流行的地区尤为明显，跨语种的说话人识别问题在身份认证、公安刑侦、国防安全等领域尤显突出。本文针对跨语种的说话人识别这一问题提出基于语种对抗训练的跨语种说话人识别算法。利用迁移学习中对抗训练的方式提高从语音中提取说话人信息的能力，进而提高对跨语种任务中说话人识别的精度。本文的主要工作和贡献包括以下几点：（1）将卷积神经网络和时延神经网络相结合，应用于说话人识别的任务上，利用深度神经网络强大的表达能力，构建了一个可以实现端到端识别说话人的网络模型，并在跨语种的说话人识别数据上验证了其有效性。实验证明卷积-时延神经网络可以有效提取语音中的说话人信息，在同语种和跨语种的说话人识别任务中均能有效使用。（2）提出了基于语种对抗训练的说话人识别算法。利用迁移学习中对抗训练的思想，在基于深度神经网络的端到端的说话人识别网络中使用语种对抗训练的方法训练网络，在训练中加入语种监督信息。实验证明，该算法继承了深度神经网络能有效提取说话人信息的特点，同时能将网络中隐藏层提取的特征信息排除语种信息干扰，有效提高了跨语种说话人识别的精度。（3）利用三元损失函数训练深度神经网络。使用三元损失函数替代常规网络训练中的交叉熵函数，将不同说话人信息和不同语种之间的信息同时引入到网络训练中，进一步提高跨语种说话人识别的精度。

著录项

作者
高骥;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科信息与通信工程
授予学位硕士
导师姓名刘文予;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类球类运动;
关键词
跨语种; 对抗训练;

相似文献

中文文献
外文文献
专利

1. 基于跨语种预训练语言模型XLM-R的神经机器翻译方法 [J] . 王倩 ,李茂西 ,吴水秀 . 北京大学学报:自然科学版 . 2022,第1期
2. 基于跨语种的医学信息资源获取方法研究 [J] . 侯震 ,侯丽 ,孙月萍 . 中国医学教育技术 . 2017,第002期
3. 基于状态映射的跨语种自适应研究 [J] . 夏菽兰 ,赵力 . 微电子学与计算机 . 2015,第4期
4. 基于共现词映射的中英韩跨语种文档相似度计算 [J] . 刘娇 ,崔荣一 ,赵亚慧 . 中文信息学报 . 2018,第003期
5. 基于译文特征的中英文跨语种抄袭识别 [J] . 袁松翔 ,刘功申 . 上海交通大学学报 . 2012,第6期
6. 基于NN-HMM模型和语种无关PRLM的自动语种识别 [C] . 王士进 ,梁加恩 ,徐波 . 第十届全国人机语音通讯学术会议 . 2009
7. 基于隐马尔可夫模型的跨语种语音合成研究 [A] . 傅海燕 . 2014

基于语种对抗训练的跨语种说话人识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅