首页> 中国专利> 基于图像视觉到文本转换的视觉问答问题解决方法

基于图像视觉到文本转换的视觉问答问题解决方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于图像视觉到文本转换的视觉问答问题解决方法。本发明一种基于图像视觉到文本转换的视觉问答问题解决方法，包括：步骤1)获取一副图像，提取CNN特征；步骤2)构建和学习图像密集字幕深度网络；步骤3)构建属性网络；步骤4)执行深度游走，对每一个获取的图像标题提取知识库增强特征；步骤5)对所有的知识库增强特征执行平均池化，获取单幅图像的知识库增强特征；步骤6)执行问题为导向的Doc2Vec特征提取；步骤7)融合知识库增强特征、Doc2Vec特征和视觉特征送入Softmax层实现分类，并最终获取给定问题的答案。本发明的有益效果：基于密集字幕方法，本发明将VQA问题转化为文本问答问题。

著录项

公开/公告号CN110717024A

专利类型发明专利
公开/公告日2020-01-21

原文格式PDF
申请/专利权人苏州派维斯信息科技有限公司;
展开▼

申请/专利号CN201910950092.2
发明设计人李群;李华康;孔令军;张坤;胡伏原;
展开▼

申请日2019-10-08
分类号
代理机构苏州市中南伟业知识产权代理事务所(普通合伙);
代理人殷海霞
地址 215000 江苏省苏州市高新区竹园路209号
入库时间 2023-12-17 05:22:44

法律信息

法律状态公告日

法律状态信息

法律状态
2020-02-21

实质审查的生效 IPC(主分类):G06F16/332 申请日:20191008

实质审查的生效
2020-01-21

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于图像视觉到文本转换的视觉问答问题解决方法 [P] . 中国专利： CN110717024A . 2020-01-21
2. 一种基于复杂网络分析方法的视觉问答问题解决方法 [P] . 中国专利： CN109255359A . 2019-01-22
3. IMAGE-BASED METHOD FOR PRESENTING AND VISUALIZING THREE-DIMENSIONAL OBJECT AND METHOD FOR PRESENTING AND VISUALIZING ANIMATED OBJECT [P] . 俄罗斯专利： RU2216781C2 . 2003-11-20

机译：基于图像的三维物体的视觉化和可视化方法以及基于动画对象的视觉化和视觉化的方法
4. Visual Question Answering Apparatus Using Hierarchical Visual Feature and Method Thereof [P] . 韩国专利： KR102011788B1 . 2019-10-21

机译：使用分层视觉特征的视觉问答装置及其方法
5. Visual Question Answering Apparatus Using Hierarchical Visual Feature and Method Thereof [P] . 韩国专利： KR20190078899A . 2019-07-05

机译：使用分层视觉特征的视觉问答装置及其方法