首页> 外文会议>International Conference on speech and computer >Phoneme Duration Prediction for Kazakh Language
【24h】

Phoneme Duration Prediction for Kazakh Language

机译:哈萨克语的音素持续时间预测

获取原文

摘要

Our research team set the goal of creating a modern speech synthesis system for the Kazakh language. One of the most important components of such system is the phoneme duration prediction. In this article, we present our work on the creation of such a classifier. We managed to develop a detector based on deep neural network, using for this purpose a minimum number of input linguistic and phonetic parameters. Based on the learning results, the proposed detector predicts the duration of phonemes on test data with a deviation of 20-25 ms on average.
机译:我们的研究团队设定了为哈萨克语创建现代语音合成系统的目标。这种系统最重要的组成部分之一是音素持续时间预测。在本文中,我们介绍了有关创建此类分类器的工作。我们设法开发了一种基于深度神经网络的检测器,为此目的,使用了最少数量的输入语言和语音参数。根据学习结果,建议的检测器预测测试数据上音素的持续时间,平均偏差为20-25毫秒。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号