首页> 中国专利> 语音音色转换方法、模型训练方法、装置、设备和介质

语音音色转换方法、模型训练方法、装置、设备和介质

页面导航

摘要
著录项
法律信息
相似文献

摘要

本公开提供了一种语音音色转换方法、模型训练方法、装置、设备和介质，涉及人工智能领域，具体为深度学习、语音合成和计算机视觉技术领域。方案为：采用语音音色转换模型中的编码分支对样本音频进行编码，得到目标声学特征；对样本音频所标注的真实文本序列进行特征提取，得到目标文本特征；根据目标声学特征和目标文本特征之间的差异对编码分支进行训练；基于与样本音频携带的标识信息对应的原始音色，采用语音音色转换模型中的解码分支对目标文本特征进行解码，得到具有原始音色的第一频谱特征；对样本音频进行频谱特征提取，得到第二频谱特征；根据第一频谱特征和第二频谱特征之间的差异对解码分支进行训练。由此，可提升语音转换的音色效果。

著录项

公开/公告号CN114360557A

专利类型发明专利
公开/公告日2022-04-15

原文格式PDF
申请/专利权人北京百度网讯科技有限公司;
展开▼

申请/专利号CN202111579876.2
发明设计人王俊超;陈怿翔;孙涛;
展开▼

申请日2021-12-22
分类号G10L21/007;G10L15/06;G10L15/26;G10L19/16;G10L25/24;
代理机构北京清亦华知识产权代理事务所(普通合伙);
代理人杜月
地址 100085 北京市海淀区上地十街10号百度大厦二层
入库时间 2023-06-19 14:57:41

法律信息

法律状态公告日

法律状态信息

法律状态
2022-04-15

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 模型的训练方法、装置、语音转换方法、设备及存储介质 [P] . 中国专利： CN112509600A . 2021-03-16
2. 语音转换方法、语音转换模型的训练方法、装置和介质 [P] . 中国专利： CN113345452A . 2021-09-03
3. 推荐系统训练方法、装置、计算机设备及存储介质 [P] . 世界知识产权组织专利： WO2020/143186A1 . 2020.07.16
4. 在虚拟场景中组合模型的方法、系统、设备和介质 [P] . 世界知识产权组织专利： WO2020/143250A1 . 2020.07.16
5. 群聊语音信息的处理方法、装置、存储介质及服务器 [P] . 世界知识产权组织专利： WO2020/143256A1 . 2020.07.16