【24h】

ENVIRONMENT FOR SPEAKER RECOGNITION USING SPEECH CODING

机译:使用语音编码识别扬声器的环境

获取原文
获取原文并翻译 | 示例

摘要

TESPAR coding (Time Encoding Signal Processing and Recognition) proposed by R.A. King represents an effectiveness alternative to the others common methods (Dynamic Time Warping, Vector Quantization, Hidden Markov Models, etc.) used for speech/speaker recognition. The important advantage of this method is the time processing of signal with a decrease of two orders of magnitude of the computational requirements. This paper presents an environment for TESPAR coding and speaker recognition aiming the following basic aspects: .wav files editing, alphabet definition and generation, TESPAR coding of the utterances providing the TESPAR-S matrix, performing the recognition experiments using a massive parallel neural networks architecture or using archetypes. The system allows "on-line" speakers enrollment and real time experiments after the recognition system training.
机译:R.A.提出的TESPAR编码(时间编码信号处理和识别)。 King代表了用于语音/说话者识别的其他常用方法(动态时间规整,矢量量化,隐马尔可夫模型等)的替代效果。这种方法的重要优点是对信号的时间处理减少了计算要求两个数量级。本文针对以下基本方面提供了TESPAR编码和说话人识别的环境:.wav文件编辑,字母定义和生成,发话的TESPAR编码(提供T​​ESPAR-S矩阵),使用大规模并行神经网络架构执行识别实验或使用原型。在识别系统训练之后,该系统允许“在线”发言人注册和实时实验。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号