首页> 中国专利> 基于说话人模型对齐的非对称语音库条件下的语音转换方法

基于说话人模型对齐的非对称语音库条件下的语音转换方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出了一种基于说话人模型对齐的非对称语音库条件下的语音转换方法，首先由源说话人和目标说话人的频谱特征分别训练得到各自的说话人模型，然后利用说话人模型中的参数找到源说话人特征向量和辅助向量之间的转换函数、辅助向量和目标说话人特征向量之间的转换函数，最后利用这两个转换函数求得源说话人和目标说话人之间的转换函数；在语音转换的过程中，使用了说话人模型对齐的方法，并且为了进一步提升语音转换的效果，还采用了将说话人模型对齐与高斯混合模型相融合的方法。实验结果表明：本发明在频谱失真度和相关度、转换语音的质量和相似度上，都取得了比传统基于INCA的语音转换方法更好的效果。

著录项

公开/公告号CN104217721B

专利类型发明专利
公开/公告日2017-03-08

原文格式PDF
申请/专利权人东南大学;
展开▼

申请/专利号CN201410399475.2
发明设计人宋鹏;赵力;金赟;
展开▼

申请日2014-08-14
分类号G10L17/04(20130101);G10L13/02(20130101);G10L21/00(20130101);G10L25/24(20130101);
代理机构32250 江苏永衡昭辉律师事务所;
代理人王斌
地址 210096 江苏省南京市四牌楼2号
入库时间 2022-08-23 09:53:39

法律信息

法律状态公告日

法律状态信息

法律状态
2017-03-08

授权

授权
2015-01-07

实质审查的生效 IPC(主分类):G10L 17/04 申请日:20140814

实质审查的生效
2014-12-17

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于说话人模型对齐的非对称语音库条件下的语音转换方法 [P] . 中国专利： CN104217721B . 2017.03.08
2. 基于自适应算法的非对称语料库条件下的语音转换方法 [P] . 中国专利： CN103280224B . 2015.09.16
3. TARGET SPEAKER ADAPTIVE VOICE CONVERSION METHOD USING DEEP LEARNING MODEL AND VOICE CONVERSION DEVICE IMPLEMENTING SAME [P] . 韩国专利： KR101666930B1 . 2016-10-24

机译：基于深度学习模型和语音转换装置实现相同的目标说话人自适应语音转换方法
4. Method for training and operating a voice/speech recognition device for recognizing a speaker's voice/speech independently of the speaker uses multiple voice/speech trial databases to form an overall operating model. [P] . 德国专利： DE10122087C1 . 2002-08-29

机译：用于独立于说话者来识别说话者的语音/语音的训练和操作语音/语音识别设备的方法使用多个语音/语音测试数据库来形成整体操作模型。
5. Eigenvoice re-estimation technique of acoustic models for speech recognition, speaker identification and speaker verification [P] . 美国专利： US6895376B2 . 2005-05-17

机译：用于语音识别，说话人识别和说话人验证的声学模型的特征语音重新估计技术