面向跨模态检索的协同注意力网络模型

邓一姣; 张凤荔; 陈学勤; 艾擎; 余苏喆

首页> 中文期刊> 《计算机科学》 >面向跨模态检索的协同注意力网络模型

面向跨模态检索的协同注意力网络模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:随着图像、文本、声音、视频等多模态网络数据的急剧增长,人们对多样化的检索需求日益强烈,其中的跨模态检索受到广泛关注。然而,由于其存在异构性差异,在不同的数据模态之间寻找内容相似性仍然具有挑战性。现有方法大都将异构数据通过映射矩阵或深度模型投射到公共子空间,来挖掘成对的关联关系,即图像和文本的全局信息对应关系,而忽略了数据内局部的上下文信息和数据间细粒度的交互信息,无法充分挖掘跨模态关联。为此,文中提出文本-图像协同注意力网络模型(CoAN),通过选择性地关注多模态数据的关键信息部分来增强内容相似性的度量。CoAN利用预训练的VGGNet模型和循环神经网络深层次地提取图像和文本的细粒度特征,利用文本-视觉注意力机制捕捉语言和视觉之间的细微交互作用;同时,该模型分别学习文本和图像的哈希表示,利用哈希方法的低存储特性和计算的高效性来提高检索速度。在实验得出,在两个广泛使用的跨模态数据集上,CoAN的平均准确率均值(mAP)超过所有对比方法,文本检索图像和图像检索文本的mAP值分别达到0.807和0.769。实验结果说明,CoAN有助于检测多模态数据的关键信息区域和数据间细粒度的交互信息,充分挖掘跨模态数据的内容相似性,提高检索精度。

著录项

来源
《计算机科学》 |2020年第4期|54-59|共6页
作者
邓一姣; 张凤荔; 陈学勤; 艾擎; 余苏喆;
展开▼
作者单位

电子科技大学信息与软件工程学院成都 610054;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
跨模态检索; 协同注意力机制; 细粒度特征提取; 深度哈希; 多模态数据;

相似文献

中文文献
外文文献
专利

1. 基于注意力双分支网络的跨模态足迹检索 [J] . 鲍文霞 ,茅丽丽 ,王年 . 东南大学学报（自然科学版） . 2021,第005期
2. 融合自注意力机制的跨模态食谱检索方法 [J] . 林阳 ,初旭 ,王亚沙 . 计算机科学与探索 . 2020,第009期
3. 基于依存关系注意力增强的跨模态检索研究 [J] . 曾辉 ,胡蓉 ,淦修修 . 华东交通大学学报 . 2020,第006期
4. 基于协同矩阵分解的单标签跨模态检索 [J] . 李新卫 ,吴飞 ,荆晓远 . 计算机技术与发展 . 2018,第011期
5. 面向传统服饰的细粒度跨模态检索算法 [J] . 赵海英 ,向翔 ,李婕 . 包装工程 . 2021,第22期
6. 军民技术集成创新的跨组织协同网络模型构建 [C] . 孔德成 ,侯光明 ,贺新闻 . 中国工程科技论坛第123场——2011国防科技工业科学发展论坛 . 2011
7. 基于依存关系注意力与社交信息的跨模态检索方法研究 [A] . 淦修修 . 2019

面向跨模态检索的协同注意力网络模型

摘要

著录项

相似文献

相关主题

期刊订阅