首页> 中国专利> 一种基于DNN-HMM双模态对齐网络的端到端语音合成方法及系统

一种基于DNN-HMM双模态对齐网络的端到端语音合成方法及系统

页面导航

摘要
著录项
相似文献

摘要

本发明公开了一种基于DNN‑HMM双模态对齐网络的端到端语音合成方法及系统，属于智能语音交互领域。本方法利用帧长预测模块替换传统端到端attention的自回归的结构，以及利用卷积变化模块和双向长短期记忆网络构建编码器和解码器，减少了大量的模型参数。通过在DNN‑HMM双模态对齐网络训练得到音素帧长序列的基础上，再去训练端到端语音合成模型，从而避免了传统端到端语音合成模型通过自回归注意力的形式来得文本和音频对齐信息的过程。训练得到的模型不仅能够保证端到端模型合成的音频的高自然度，而且能够大幅降低语音合成时的计算资源消耗以及时间占比，从而能够实现在低计算资源的硬件上部署端到端语音合成技术。

著录项

公开/公告号CN111739508B

专利类型发明专利
公开/公告日2020-12-01

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN202010788375.4
发明设计人陈飞扬;赵洲;
展开▼

申请日2020-08-07
分类号G10L13/02(20130101);G10L15/06(20130101);G10L15/14(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构33200 杭州求是专利事务所有限公司;
代理人郑海峰
地址 310058 浙江省杭州市西湖区余杭塘路866号
入库时间 2022-08-23 11:23:58

相似文献

专利
中文文献
外文文献

1. 一种基于DNN-HMM双模态对齐网络的端到端语音合成方法及系统 [P] . 中国专利： CN111739508B . 2020.12.01
2. 一种基于DNN-HMM双模态对齐网络的端到端语音合成方法及系统 [P] . 中国专利： CN111739508A . 2020-10-02
3. A web-based system for measuring and diagnosing end-to-end performance of network with high-speed sections and method thereof [P] . 韩国专利： KR100959663B1 . 2010-05-26

机译：一种基于网络的高速段网络端到端性能测量和诊断系统及其方法
4. A WEB-BASED SYSTEM FOR MEASURING AND DIAGNOSING END-TO-END PERFORMANCE OF NETWORK WITH HIGH-SPEED SECTIONS AND METHOD THEREOF [P] . 韩国专利： KR20090091885A . 2009-08-31

机译：一种基于Web的高速段网络端到端性能测量与诊断系统及其方法
5. A digital video survellience system based on compression to build end to end IP network between distant camera posts and control rooms. [P] . 英国专利： GB0820049D0 . 2008-12-10

机译：一种基于压缩的数字视频监视系统，可在遥远的摄像机杆和控制室之间建立端到端IP网络。