首页> 外国专利> Cross-lingual speaker adaptation for multi-lingual speech synthesis

Cross-lingual speaker adaptation for multi-lingual speech synthesis

机译:跨语言说话者自适应,可进行多语言语音合成

摘要

The subject matter of the disclosure is embodied in a method that includes receiving input speech data from a speaker in a first language, and estimating, based on a universal speech model, a speaker transform representing speaker characteristics associated with the input speech data. The method also includes accessing a speaker-independent speech model for generating speech data in a second language that is different from the first language. The method further includes modifying the speaker-independent speech model using the speaker transform to obtain a speaker-specific speech model, and generating speech data in the second language using the speaker-specific speech model.
机译:本公开的主题体现在一种方法中,该方法包括以下步骤:从说话者以第一语言接收输入语音数据,并且基于通用语音模型估计代表与输入语音数据相关联的说话者特性的说话者变换。该方法还包括访问独立于说话者的语音模型,以生成不同于第一语言的第二语言的语音数据。该方法还包括:使用说话者变换来修改与说话者无关的语音模型,以获得说话者特定的语音模型;以及使用说话者特定的语音模型以第二语言生成语音数据。

著录项

  • 公开/公告号US9922641B1

    专利类型

  • 公开/公告日2018-03-20

    原文格式PDF

  • 申请/专利权人 GOOGLE INC.;

    申请/专利号US201213665390

  • 发明设计人 BYUNG HA CHUN;

    申请日2012-10-31

  • 分类号G10L13/00;G10L13/06;G10L15/06;G10L15/07;G10L15/02;G10L21/013;

  • 国家 US

  • 入库时间 2022-08-21 12:57:38

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号