面向跨模态检索的音频数据库内容匹配方法研究

张天; 靳聪; 帖云; 李小兵

首页> 中文期刊> 《信号处理》 >面向跨模态检索的音频数据库内容匹配方法研究

面向跨模态检索的音频数据库内容匹配方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

跨模态检索旨在通过以某一模态的数据为查询词,使人们能够得到与之相关的其他不同模态数据的检索结果的新型检索方法,这已成为多媒体和信息检索领域中一个有趣的研究问题.但是,目前大多数的研究成果集中于文本到图像、文本到视频以及歌词到音频等跨模态相关任务上,而关于如何为特定的视频通过跨模态检索得到合适的音乐这一跨模态的相关研究却很有限.此外,大多现有的关于视频和音频跨模态的研究依赖于元数据(例如关键字,标签或描述).本文介绍了一种基于音频和视频这两种模态数据内容的跨模态检索的方法,该方法以新型的双流处理网络为框架,并通过神经网络学习两模态数据在公共子空间的特征表达,以计算音频和视频数据之间的相似度.本文所提出的方法的创新点主要在以下三个方面:1)在原有的提取各模态特征的模型基础上引入注意力机制,以此得到了视频和音频的特征选择模型,并筛选出相应的特征表达.2)使用了样本挖掘机制,剔除了无效样本,使得数据的训练更加高效.3)从计算模态间相似性和保持模态内结构不变两方面出发,利用了相应的损失函数进行模型的训练.且所提出的模型在VEGAS数据集和自建数据集上都取得了较高的准确度.

著录项

来源
《信号处理》 |2020年第6期|966-976|共11页
作者
张天; 靳聪; 帖云; 李小兵;
展开▼
作者单位

郑州大学信息工程学院河南郑州450000;

中国传媒大学信息与通信工程学院北京100000;

郑州大学信息工程学院河南郑州450000;

中央音乐学院北京100000;

展开▼
原文格式 PDF
正文语种 chi
中图分类多媒体技术与多媒体计算机;
关键词
深度学习; 公共子空间; 跨模态检索;

相似文献

中文文献
外文文献
专利

1. 基于分治思想粗匹配和精微匹配相结合的跨模态检索算法 [J] . 苏林 ,卜巍 ,邬向前 . 智能计算机与应用 . 2020,第006期
2. 基于分治思想粗匹配和精微匹配相结合的跨模态检索算法 [J] . 苏林 ,卜巍 ,邬向前 . 智能计算机与应用 . 2020,第006期
3. 一致性协议匹配的跨模态图像文本检索方法 [J] . 宫大汉 ,陈辉 ,陈仕江 . 智能系统学报 . 2021,第006期
4. 面向传统服饰的细粒度跨模态检索算法 [J] . 赵海英 ,向翔 ,李婕 . 包装工程 . 2021,第22期
5. 面向跨模态检索的协同注意力网络模型 [J] . 邓一姣 ,张凤荔 ,陈学勤 . 计算机科学 . 2020,第004期
6. 广播音频数据库的智能化检索技术 [C] . 谢凌云 ,齐娜 ,孟子厚 . 第五届全国因特网与音视频广播发展研讨会 . 2005
7. 基于语义匹配的跨模态多媒体检索方法研究 [A] . 陈祥 . 2018

面向跨模态检索的音频数据库内容匹配方法研究

摘要

著录项

相似文献

相关主题

期刊订阅