首页> 中文期刊> 《电视技术》 >基于图文多模态门控增强的文本平行句对抽取方法

基于图文多模态门控增强的文本平行句对抽取方法

         

摘要

目前,主流平行句对抽取方法大都采用预训练模型加微调的策略,并基于句子语义相似性实现平行句对的抽取。但该方法对词级实体级等细粒度的对齐考虑不足,使得获取的平行句对在词粒度上存在噪声,影响了平行句对的质量。图像是一种语言无关的模态,可以跨越语言之间的语义鸿沟,且包括丰富的词级或实体信息。本文以图像模态为双语对齐的锚点,基于多模态门控增强,实现图像模态信息在双语表征端的自适应融合,最终实现平行句对的判别。本文所提的方法无需提前进行图像和文本的对齐标注。首先,从预构建好的图像数据库中基于词级或实体粒度对齐抽取源语言和目标语言的相关的图像模态信息;其次,基于图文多模态门控的方式分别实现源语言和目标语言图文信息的融合,获得图像增强后的文本语义表征;最后,将双语表征信息进行融合,实现平行句对抽取。所提方法在英语-越南语、英语-德语双语平行句对抽取任务上进行了实验,证明了融合图像信息对文本平行句对抽取的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号