编码-解码技术的图像标题生成方法研究综述

耿耀港; 梅红岩; 张兴; 李晓会

首页> 中文期刊> 《计算机科学与探索》 >编码-解码技术的图像标题生成方法研究综述

编码-解码技术的图像标题生成方法研究综述

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

近年来,图像标题生成作为人工智能领域中的多模态任务,融合了计算机视觉和自然语言处理的相关研究,能够实现从图像到文本的模态转换,在视觉辅助和图像理解等方面有着重要作用,备受研究者们的广泛关注。首先对图像标题生成任务进行了阐述,介绍了三种图像标题生成方法,基于模板的方法、基于检索的方法和基于编码-解码的方法以及各自的方法思路、代表性研究和优缺点。其次从方法的模型构成、图像理解阶段和标题生成阶段的研究进展等方面对基于编码-解码的方法进行了详细阐述。将近年来的研究总结归纳为图像理解方面的研究和标题生成方面的研究,其中图像理解方面的研究包括注意力机制的研究和语义获取方面的研究,标题生成方面的研究分为传统标题、密集标题和个性化标题生成的研究,并总结了模型性能及优缺点,介绍了图像标题生成模型进行性能评估的数据集和评测指标。最后指出图像标题生成领域研究面对的挑战和难点。

著录项

来源
《计算机科学与探索》 |2022年第10期|2234-2248|共15页
作者
耿耀港; 梅红岩; 张兴; 李晓会;
展开▼
作者单位

辽宁工业大学电子与信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
图像标题生成; 编码; 解码; 多模态; 注意力机制;

相似文献

中文文献
外文文献
专利

1. 图像标题生成中的人物类名实体填充方法研究 [J] . 张家硕 ,洪宇 ,唐建 . 中文信息学报 . 2019,第9期
2. 基于注意力机制和编码-解码架构的施工场景图像描述方法 [J] . 农元君 ,王俊杰 ,陈红 . 浙江大学学报:工学版 . 2022,第2期
3. 联合边路和中路解码特征学习的多描述编码图像增强方法 [J] . 赵利军 ,曹聪颖 ,张晋京 . 计算机应用研究 . 2022,第9期
4. 信息处理技术——图像压缩编码方法综述 [J] . 孟宪伟 ,晏磊 . 中国学术期刊文摘 . 2007,第012期
5. 基于深度学习的标题生成方法综述 [J] . 蒋敏 . 信息与电脑 . 2018,第18期
6. DM+:一种融合数字编码的可扫描图像生成技术 [C] . YU Jian-nan ,于剑楠 ,LI Qing-feng . 第十七届中国虚拟现实大会暨虚拟现实与可视化国际会议（ChinaVRICVRV2017） . -1
7. 基于互助双向LSTM与递进解码机制的图像标题生成 [A] . 闫泽杭 . 2018

编码-解码技术的图像标题生成方法研究综述

摘要

著录项

相似文献

相关主题

期刊订阅