音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

酒井啓行; ツィンツァレクトビアス; 川波弘道; 猿渡洋; 鹿野清宏; 李晃伸; SAKAI Hiroyuki; CINCAREK Tobias; KAWANAMI Hiromichi; SARUWATARI Hiroshi; SHIKANO Kiyohiro; LEE Akinobu

首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

【24h】

音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

机译：基于声学模型和语言模型的音频截面检测评估免提语音识别算法

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

人と音声対話ロボットとの自然な対話を可能にするためにハンズフリーインターフェースの導入が求められている.ハンズフリー音声認識システムでは様々な背景雑音の混入や,ユーザの直接音のパワーが減衰するなど様々な理由で入力音声のSignal-to-Noise Ratio (SNR)が低下してしまう.そしてSNRの低下に伴いユーザの発話区間を特定する音声区間検出が困難となる,また雑音環境における有効な音声区間検出手法は確立されていない.本稿では,雑音環境下においても頑健にユーザの発話区間を検出する音響モデルと言語モデルに基づく認識による音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価を行う.従来のVAD手法として振幅パワー,統計モデル,GMMなどに基づく手法を挙げ,性能比較実験を行うことで提案手法の有効性を示す.

机译：为了实现与人和语音对话机器人的自然互动。免提语音识别系统衰减各种背景噪声混合和用户直接声音。由于各种原因，输入语音的信噪比（SNR）减少了。由于SNR的减少，难以检测识别用户的语音部分的语音部分，并且有效地在噪声环境中尚未建立音频部分检测方法。在本文中，我们评估免提言论通过基于语音和语言模型的识别感测识别算法，即使在噪声环境下检测用户的话语间隔的语音和语言模型。作为传统的VAD方法，一种基于幅度功率，统计模型，GMM等的方法。给出，进行性能比较实验以显示所提出的方法的有效性。

著录项

来源
《電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication》 |2007年第405期|共6页
作者
酒井啓行; ツィンツァレクトビアス; 川波弘道; 猿渡洋; 鹿野清宏; 李晃伸; SAKAI Hiroyuki; CINCAREK Tobias; KAWANAMI Hiromichi; SARUWATARI Hiroshi; SHIKANO Kiyohiro; LEE Akinobu;
展开▼
作者单位

奈良先端科学技術大学院大学情報科学研究科;

奈良先端科学技術大学院大学情報科学研究科;

奈良先端科学技術大学院大学情報科学研究科;

奈良先端科学技術大学院大学情報科学研究科;

奈良先端科学技術大学院大学情報科学研究科;

名古屋工業大学;

Graduate School of Information Science Nara Institute of Science and Technology;

Graduate School of Information Science Nara Institute of Science and Technology;

Graduate School of Information Science Nara Institute of Science and Technology;

Graduate School of Information Science Nara Institute of Science and Technology;

Graduate School of Information Science Nara Institute of Science and Technology;

Nagoya Institute of Technology;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类通信;
关键词
音響モデルと言語モデルに基づく認識による音声区間検出; ハンズフリー音声認識; 実環境対話ロボット; Voice Activity Detection (VAD) by decoding based on Acoustic Model and Language Model; Hands-Free speech recognition; Real-environment spoken dialogue robot;

机译：基于声学模型的识别和语言模型的语音活动检测;免提语音识别;一个真正的环境交互机器人;语音活动检测（VAD）通过基于声学模型和语言模型进行解码;免提语音识别;真实环境口头对话机器人;

相似文献

外文文献
中文文献
专利

1. 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価 [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第406期

机译：基于声学模型和语言模型的语音间隔检测免提语音识别算法的评估
2. 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価 [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 音声. Speech . 2007,第406期

机译：基于声学模型和语言模型的音频截面检测评估免提语音识别算法
3. 音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価 [J] . 酒井啓行, ツィンツァレクトビアス, 川波弘道, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2007,第405期

机译：基于声学模型和语言模型的音频截面检测评估免提语音识别算法
4. フィルタリングアルゴリズムを逆解析手法とする5層フレームモデルの水平剛性の同定:その１拡張カルマンフィルタと拡張VPPFに基づくアルゴリズム [C] . 遠藤龍司, 池田義人, 登坂宣好日本建築学会大会;日本建築学会 . 2013

机译：使用滤波算法作为逆分析方法识别5层框架模型的水平刚度：第1部分基于扩展卡尔曼滤波器和扩展VPPF的算法
5. 肝機能障害の評価法とその障害機序に関する研究; ヒト肝ミトコンドリアの日内代謝変動に基づく肝機能評価及び動物モデルを用いた肝ミトコンドリア障害機序 [D] . Iwata, Shingo 1993

机译：肝功能障碍评估方法及其机制的研究；基于人肝线粒体每日代谢变化和肝线粒体损伤机制的动物模型对肝功能的评估
6. 聴覚大脳系のモデルに基づく音場の心理的反応に関する研究: 相互相関メカニズムおよび自己相関メカニズムから抽出されたファクターに基づく評価 [O] . Sato Shin-ichi 1999

机译：基于听觉大脑系统模型的声场心理反应研究：基于互相关机制和自相关机制提取的因素的评估

音響モデルと言語モデルに基づく音声区間検出を用いたハンズフリー音声認識アルゴリズムの評価

摘要

著录项

相似文献

相关主题

期刊订阅