首页> 外文会议>映像情報メディア学会研究会 >Visual Question Answeringのための多種質問回答生成とTransformerを用いたァータム張
【24h】

Visual Question Answeringのための多種質問回答生成とTransformerを用いたァータム張

机译:使用Transformer为Visual Question Answering和Artham Zhang生成多问题答案

获取原文

摘要

あらましVisual Question Answering (VQA)は,画像とその画像に対する質問文が自然言語で与えられ,質問に対 する正しい回答を自然言語で出力する問題設定である.本論文では,VQAにおける半教師あり学習のために敵対的 学習を用いた多種質問解答生成モデルを利用する手法と,自然言語処理分野で用いられているTransformerモデル を利用してVQAデータの学習時にデータ拡張を行う手法を提案する.
机译:摘要视觉问答(VQA)是一个问题设置,其中以自然语言给出图像和图像的问题文本,并以自然语言输出对该问题的正确答案。 VQA为此,我们提出了一种使用敌对学习的多问题答案生成模型的方法,以及一种在学习VQA数据时使用自然语言处理领域中使用的Transformer模型扩展数据的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号