...
首页> 外文期刊>Advanced Science Letters >Speech Separation and Recognition Using CASA Segmentation and Language-Based Grouping
【24h】

Speech Separation and Recognition Using CASA Segmentation and Language-Based Grouping

机译:使用CASA分段和基于语言分组的语音分离和识别

获取原文
获取原文并翻译 | 示例
           

摘要

We consider a monaural speech recognition problem in the case of multi-talker environment and difficult nonstationary noises. We propose a new method of computational auditory scene analysis (CASA) that uses a language model along with acoustic continuity for speech separation. Unlikeprevious works, our algorithm does not depend on a fixed set of speakers, so it could be used in a general-purpose speech recognition system. The algorithm works in two stages. First, it produces time-frequency signal segmentation. Then, a grouping stage composes segments into streams, witheach stream corresponding to either speech or noise. In our approach, text recognition and separation are parts of a single process. Our experiments show 17% WER improvement over the baseline for a 0 dB environment.
机译:我们考虑在多讲话者环境和困难的非间平噪声的情况下进行单声道语音识别问题。 我们提出了一种新的计算听觉场景分析(CASA)的方法,它使用语言模型以及用于语音分离的声学连续性。 与Previous的作品,我们的算法不依赖于固定的一组扬声器,因此可以在通用语音识别系统中使用。 该算法在两个阶段工作。 首先,它产生时频信号分割。 然后,分组阶段将段组成流中,进入对应于语音或噪声的流。 在我们的方法中,文本识别和分离是单个过程的一部分。 我们的实验显示出0 dB环境的基线上有17%的改善。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号