首页> 中国专利> 一种个性化语音合成模型网络训练及个性化语音合成方法

一种个性化语音合成模型网络训练及个性化语音合成方法

摘要

本发明公开了一种个性化语音合成模型网络训练及个性化语音合成方法,包括如下步骤:步骤1.采集单人高质量音频数据训练出基准模型A1,步骤2.搭建发音人音色编码网络,用于将发音人编码。步骤3.利用步骤2中的发音人音色编码网络A2计算步骤1中所有基准模型的音色编码,得到基准模型音色编码;步骤4.筛选修正模型基准A3,并利用A3通过迁移学习生成单人合成模型;步骤5.重复步骤4所有操作,得到多个发音人单人合成模型A4以及标签;步骤6.形成合成模型网络A5。本发明可以仅通过少量发音人音频与待合成文本,快速搜索出最匹配模型来合成该段文本对应的语音;相比于现有的技术所需要的单人语料数据更少,合成实时性更高。

著录项

  • 公开/公告号CN112133278A

    专利类型发明专利

  • 公开/公告日2020-12-25

    原文格式PDF

  • 申请/专利权人 成都启英泰伦科技有限公司;

    申请/专利号CN202011309759.X

  • 发明设计人 陈佩云;何云鹏;许兵;

    申请日2020-11-20

  • 分类号G10L13/02(20130101);

  • 代理机构

  • 代理人

  • 地址 610041 四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层

  • 入库时间 2023-06-19 09:19:57

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号