...
首页> 外文期刊>電子情報通信学会技術研究報告. 信号処理. Signal Processing >雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識
【24h】

雑音抑圧とSPLICEを組み合わせた雑音環境下音声認識

机译:结合了噪音抑制和SPLICE的嘈杂环境中的语音识别

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

近年携帯端末やカーナビゲーションシステムなどを,音声入力を用いて操作する場面が多くなっている.しかし実環境下での音声入力は様々な雑音が混入してしまい,クリーン環境で構築された音響モデルのみが使われていた場合,認識率の大きな低下を招くことになる.音声の特徴量から雑音の影響を取り除く手法は特徴量正規化,特徴強調など様々な手法が提案されているが,単一の手法で影響をすべて取り除くことは難しい.そこで本稿ではこれらの手法を組み合わせてより雑音に頑健な音声認識を目指す.SPLICE(Stereo-Piecewise Linear Compensation for Environments)は任意の特徴量を入力として扱える高い汎用性を持っている.そこで既存手法とSPLICEの組み合わせの中で,各手法の特性が有効に働くを組み合わせを検討する.Aurora-2データベースを用いた英語連続数字音声認識のタスクにおいて,AFE(Advanced Front-End),SPLICE,HEQ(Histogram EQualization)を順番に適用した特徴量がどの環境においても優れた性能を示した.
机译:近年来,存在许多使用语音输入来操作移动终端和汽车导航系统的情况。但是,在真实环境中,语音输入中会混入各种噪声,如果仅使用在干净环境中构建的声学模型,则识别率将大大降低。已经提出了诸如特征量归一化和特征增强之类的各种方法作为从语音的特征量中去除噪声的影响的方法,但是很难用一种方法来去除所有的影响。因此,在本文中,我们的目标是通过结合使用这些方法,使语音识别对噪声更鲁棒。 SPLICE(环境立体声方向线性补偿)具有很高的通用性,可以处理任意特征量作为输入。因此,在现有方法和SPLICE的组合中,我们将研究其中每种方法的特征都能有效发挥作用的组合。在使用Aurora-2数据库进行英语连续号码语音识别的任务中,按顺序应用AFE(高级前端),SPLICE和HEQ(直方图均衡化)的功能在任何环境下均表现出出色的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号