...
首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価
【24h】

音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

机译:基于声学模型和语言模型的音频截面检测评估免提语音识别算法

获取原文
获取原文并翻译 | 示例
           

摘要

人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響モデルと言語モデルに基づく認識による音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価を行う.従来のVAD手法として振幅パワー,統計モデル,GMMなどに基づく手法を挙げ,性能比較実験を行うことで提案手法の有効性を示す.
机译:为了实现与人和语音对话机器人的自然互动。免提语音识别系统衰减各种背景噪声混合和用户直接声音。由于各种原因,输入语音的信噪比(SNR)减少了。由于SNR的减少,难以检测识别用户的语音部分的语音部分,并且有效地在噪声环境中尚未建立音频部分检测方法。在本文中,我们评估免提言论通过基于语音和语言模型的识别感测识别算法,即使在噪声环境下检测用户的话语间隔的语音和语言模型。作为传统的VAD方法,一种基于幅度功率,统计模型,GMM等的方法。给出,进行性能比较实验以显示所提出的方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号