...
首页> 外文期刊>電子情報通信学会技術研究報告 >[招待講演]音声·画像情報の融合処理を目指して
【24h】

[招待講演]音声·画像情報の融合処理を目指して

机译:[特邀演讲]走向音频和图像信息的融合处理

获取原文
获取原文并翻译 | 示例
           

摘要

In this paper, multimodal processing done by the author is described using and integrating vision and speech, as well as multimedia processing for documents, images, videos and speech. Next, situation or event recognition and intention recognition are described based on multiple media and modalities. Finally new processing is described by using same method between speech and image.%文書、画像、映像、音声を対象としたマルチメディアの処理研究と、視覚、聴覚といったモダリティを統合するマルチモーダル処理研究に関して、筆者の研究内容の概要を述べる。次に、複数のメディアゃモダリティから得られるデータ·情報を基に、場の状況認識や人の意図認識を行う研究について述べる。最後に、音声と画像間で、同じ手法を用いることから得られる新たな処理内容についても述べる。
机译:本文介绍了作者使用视觉和语音进行的多模式处理以及对文档,图像,视频和语音的多媒体处理。接下来,描述了基于多种媒体和模式的情况或事件识别和意图识别。最后,通过在语音和图像之间使用相同的方法来描述新的处理。%关于文档,图像,视频和音频的多媒体处理的研究,以及整合了视觉和听觉等模式的多模式处理的研究,概述研究内容。接下来,我们描述一项研究,该研究基于从多种媒体和方式获得的数据和信息来识别人的位置和意图。最后,还描述了通过在语音和图像之间使用相同方法获得的新处理内容。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号