首页> 外文期刊>電気学会論文誌 C:電子·情報·システム部門誌 >HMM音声合成に基づく音声認識率予測手法



获取原文并翻译 | 示例


本論文では音声認識率を予測する手法について述べた。rn本手法はHMMに基づく音声合成手法を音声認識器へのテrnストパタン生成器に応用することによって,単語別の認識rn率,および話者別の認識率を評価するものである。rnまた孤立単語認識の実験を通して,HMMに基づいた合rn成音声が,美音声に対する音声認識率という観点でも高いrn一致を示すことを示した。%We describe an efficient method that uses a HMM-based speech synthesis technique as a test pattern generator for evaluating the word recognition rate. The recognition rates of each word and speaker can be evaluated by the synthesized speech by using this method. The parameter generation technique can be formulated as an algorithm that can determine the speech parameter vector sequence O by maximizing P(O|Q, λ) given the model parameter A and the state sequence Q, under a dynamic acoustic feature constraint. We conducted recognition experiments to illustrate the validity of the method. Approximately 100 speakers were used to train the speaker dependent models for the speech synthesis used in these experiments, and the synthetic speech was generated as the test patterns for the target speech recognizer. As a result, the recognition rate of the HMM-based synthesized speech shows a good correlation with the recognition rate of the actual speech. Furthermore, we find that our method can predict the speaker recognition rate with approximately 2% error on average. Therefore the evaluation of the speaker recognition rate will be performed automatically by using the proposed method.
机译:在本文中,我们描述了一种预测语音识别率的方法。该方法通过将基于HMM的语音合成方法应用于语音识别器的tern模式生成器来评估每个单词的识别率和每个说话者的识别率。我们还通过孤立单词识别实验证明,基于HMM的组合rn合成语音在优美语音的语音识别率方面显示出很高的rn一致性。我们描述了一种有效的方法,该方法使用基于HMM的语音合成技术作为测试模式生成器来评估单词识别率,使用此方法可以通过合成语音评估每个单词和说话者的识别率。可以将这种技术表述为一种算法,该算法可以在动态声学特征约束下,通过在给定模型参数A和状态序列Q的情况下最大化P(O | Q,λ)来确定语音参数矢量序列O。这些实验中使用了大约100位说话者来训练与说话者相关的语音合成模型,然后生成合成语音作为目标语音识别器的测试模式。基于HMM的合成语音与实际语音的识别率具有良好的相关性。估计说话人识别率的平均误差约为2%,因此使用所提出的方法将自动执行说话人识别率的评估。



  • 外文文献
  • 中文文献
  • 专利


京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号