首页> 中国专利> 一种基于主要目标面向场景的文字字幕生成方法

一种基于主要目标面向场景的文字字幕生成方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种基于主要目标面向场景的文字字幕生成方法，涉及图像描述生成技术领域技术领域。对图像进行预处理得到包括关于M个物体中每个物体的物体区域框坐标、物体视觉特征、物体表征向量和关于N个文字中每个文字的文字区域框坐标、文字视觉特征、文字表征向量的样本数据；建立物体区域框坐标和文字区域框坐标之间的图关系；图卷积网络模型根据图关系对物体表征向量、文字表征向量进行增强得到增强特征；将增强特征发送到解码模型进行解码得到表述图片内容的句子。引入场景文字的主要目标概念，去除了场景图中冗余和干扰信息。关注图像中物体的同时也注重了图像的文本与物体之间的关系，生成的句子对场景文字的描述字幕更加准确。

著录项

公开/公告号CN115546571A

专利类型发明专利
公开/公告日2022-12-30

原文格式PDF
申请/专利权人合肥工业大学;
展开▼

申请/专利号CN202211211730.7
发明设计人胡珍珍;唐文亮;宋子杰;洪日昌;
展开▼

申请日2022-09-30
分类号G06V10/77;G06V10/82;G06N3/04;G06N3/08;
代理机构北京睿智保诚专利代理事务所(普通合伙);
代理人韩迎之
地址 230009 安徽省合肥市屯溪路193号
入库时间 2023-06-19 18:09:45

法律信息

法律状态公告日

法律状态信息

法律状态
2022-12-30

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于注意力机制卷积神经网络的自然场景文字检测方法 [P] . 中国专利：
2. 基于场景图更新与特征拼接的图像字幕生成方法 [P] . 中国专利： CN113918754A . 2022-01-11
3. 基于特征复用和类时序注意力机制的三维场景字幕生成方法 [P] . 中国专利： CN115527201A . 2022-12-27
4. Automated Method for Generating Scenario-Based Multi-Threaded Implementations from Real-Time Object-Oriented Models [P] . 韩国专利： KR100610362B1 . 2006-08-16

机译：从实时面向对象模型生成基于场景的多线程实现的自动化方法
5. METHOD FOR AUTOMATICALLY GENERATING SCENARIO-BASED MULTITHREAD IMPLEMENTATION GUARANTEEING SCHEDULABILITY FOR REAL-TIME OBJECT-ORIENTED MODEL [P] . 韩国专利： KR20050010639A . 2005-01-28

机译：面向对象的模型的基于场景自动生成的多线程实施保证调度方法
6. Method for target-oriented information generation from computer-based network, requires transferring sentence analysis results to different research devices [P] . 德国专利： DE10310555A1 . 2004-09-23

机译：从基于计算机的网络生成面向目标的信息的方法，需要将句子分析结果传输到不同的研究设备