从隐空间认识CLIP多模态模型

高焕堂

首页> 中文期刊> 《电子产品世界》 >从隐空间认识CLIP多模态模型

从隐空间认识CLIP多模态模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

1前言AIGC可生成的内容形式包含文本(文句)、图像、音频和视频。它能将文本中的语言符号信息或知识,与视觉中可视化的信息(或知识)建立出对应的关联。两者互相加强,形成图文并茂的景象,激发人脑更多想象,扩大人们的思维空间。其中,最基础的就是文本(Text)与图像(Image)之间的知识关联。本篇来介绍文本与图像的关联,并以CLIP模型为例,深入介绍多模态AIGC模型的幕后架构,例如隐空间(Latent space)就是其中的关键性机制。

著录项

来源
《电子产品世界》 |2023年第5期|8-9|共3页
作者
高焕堂;
展开▼
作者单位

铭传大学;

长庚大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算技术、计算机技术;
关键词
隐空间; 知识关联; 多模态模型; CLIP; 图文并茂; 思维空间; 可视化; AIG;

相似文献

中文文献
外文文献
专利

1. 基于CLIP模型的军事领域图片资源多模态搜索工具研究 [J] . 赵晋巍 ,刘晓鹏 ,罗威 . 中华医学图书情报杂志 . 2022,第8期
2. 基于EM算法和模态形式的状态空间模型自降阶工作模态分析 [J] . 施袁锋 ,朱正言 ,陈鹏 . 工程力学 . 2021,第9期
3. 基于无意识多模态内隐测量的产品意象提取模型构建 [J] . 郭主恩 ,林丽 ,阳明庆 . 计算机集成制造系统 . 2022,第4期
4. 平衡空间到模态空间的反映射模型降阶方法 [J] . 曹丽 ,周志成 ,曲广吉 . 中国空间科学技术 . 2012,第6期
5. 隐相空间的DUPSO-RPSOVF语音预测模型研究 [J] . 吴霞 ,吴晓军 ,史素真 . 电子学报 . 2019,第009期
6. 基于耦合隐马尔科夫模型的听觉视觉双模态语音识别 [C] . . 第六届全国人机语音通讯学术会议 . 2001
7. 基于模态分解和隐马尔可夫模型的滚动轴承故障诊断方法研究 [A] . 龙舟 . 2021

从隐空间认识CLIP多模态模型

摘要

著录项

相似文献

相关主题

期刊订阅