首页> 中文学位 >基于语种对抗训练的跨语种说话人识别研究
【6h】

基于语种对抗训练的跨语种说话人识别研究

代理获取

目录

第一个书签之前

展开▼

摘要

近年来,随着科技的高速发展,人们越来越多的关注到生活中的信息安全和身份认证,个人信息、保密信息的泄漏不但对个人的人身、财产安全造成严重威胁,也会对社会的发展带来不利的影响。目前,身份证件、口令密码等传统的身份认证和鉴别的方法已经不能完全满足人们的需求,而基于生物特征的身份鉴别技术以其方便、可靠等特性,越来越多的得到了人们的关注。语音作为人们日常生活中交流沟通最直接、最便捷的方式,其中衍生出的说话人识别技术也成为研究的热点和重点 随着国际化浪潮的推进,单一的语言已经完全不能满足人们的日常生活、工作和学习的需要。我国幅员辽阔,是一个多民族融合的国家,有着丰富的少数民族语言和地区方言,这种情况在我国南部和西部的粤语、藏语、维语等与中文普通话差异较大的方言和民族语言流行的地区尤为明显,跨语种的说话人识别问题在身份认证、公安刑侦、国防安全等领域尤显突出。 本文针对跨语种的说话人识别这一问题提出基于语种对抗训练的跨语种说话人识别算法。利用迁移学习中对抗训练的方式提高从语音中提取说话人信息的能力,进而提高对跨语种任务中说话人识别的精度。本文的主要工作和贡献包括以下几点: (1)将卷积神经网络和时延神经网络相结合,应用于说话人识别的任务上,利用深度神经网络强大的表达能力,构建了一个可以实现端到端识别说话人的网络模型,并在跨语种的说话人识别数据上验证了其有效性。实验证明卷积-时延神经网络可以有效提取语音中的说话人信息,在同语种和跨语种的说话人识别任务中均能有效使用。 (2)提出了基于语种对抗训练的说话人识别算法。利用迁移学习中对抗训练的思想,在基于深度神经网络的端到端的说话人识别网络中使用语种对抗训练的方法训练网络,在训练中加入语种监督信息。实验证明,该算法继承了深度神经网络能有效提取说话人信息的特点,同时能将网络中隐藏层提取的特征信息排除语种信息干扰,有效提高了跨语种说话人识别的精度。 (3)利用三元损失函数训练深度神经网络。使用三元损失函数替代常规网络训练中的交叉熵函数,将不同说话人信息和不同语种之间的信息同时引入到网络训练中,进一步提高跨语种说话人识别的精度。

著录项

  • 作者

    高骥;

  • 作者单位

    华中科技大学;

  • 授予单位 华中科技大学;
  • 学科 信息与通信工程
  • 授予学位 硕士
  • 导师姓名 刘文予;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 球类运动;
  • 关键词

    跨语种; 对抗训练;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号