用于语音检索的三联体深度哈希方法

张秋余; 温永旺

首页> 中文期刊> 《计算机应用》 >用于语音检索的三联体深度哈希方法

用于语音检索的三联体深度哈希方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

现有基于内容的语音检索中深度哈希方法对监督信息利用不足,生成的哈希码是次优的,而且检索精度和检索效率不高。针对以上问题,提出一种用于语音检索的三联体深度哈希方法。首先,将语谱图图像特征以三联体方式作为模型的输入来提取语音特征的有效信息;然后,提出注意力机制-残差网络(ARN)模型,即在残差网络(ResNet)的基础上嵌入空间注意力力机制,并通过聚集整个语谱图能量显著区域信息来提高显著区域表示;最后,引入新三联体交叉熵损失,将语谱图图像特征之间的分类信息和相似性映射到所学习的哈希码中,可在模型训练的同时实现最大的类可分性和最大的哈希码可分性。实验结果表明,所提方法生成的高效紧凑的二值哈希码使语音检索的查全率、查准率、F1分数均超过了98.5%。与单标签检索等方法相比,使用Log-Mel谱图作为特征的所提方法的平均运行时间缩短了19.0%~55.5%,能在减小计算量的同时,显著提高检索效率和精度。

著录项

来源
《计算机应用》 |2023年第9期|2910-2918|共9页
作者
张秋余; 温永旺;
展开▼
作者单位

兰州理工大学计算机与通信学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
语音检索; 三联体深度哈希; 注意力机制; 语谱图特征; 三联体交叉熵损失;

相似文献

中文文献
外文文献
专利

1. 基于深度多相似性哈希方法的遥感图像检索 [J] . 何悦 ,陈广胜 ,景维鹏 . 计算机工程 . 2023,第2期
2. 基于Swin Transformer的深度有监督哈希图像检索方法 [J] . 苗壮 ,赵昕昕 ,李阳 . 湖南大学学报:自然科学版 . 2023,第8期
3. 基于深度哈希的数字档案图像检索方法 [J] . 陈静雯 ,成新民 ,王少阳 . 数字技术与应用 . 2023,第9期
4. 基于深度哈希网络的肺结节CT相似图像检索方法研究 [J] . 郝瑞 ,秦亚雪 ,甄俊平 . 中山大学学报:医学科学版 . 2022,第4期
5. 基于深度残差网络的迭代量化哈希图像检索方法 [J] . 廖列法 ,李志明 ,张赛赛 . 计算机应用 . 2022,第9期
6. 基于深度哈希的多模态视频拷贝检测方法 [C] . 张乃光 ,石慧杰 ,祝晓斌 . 第二届数字版权管理创新发展论坛 . 2018
7. 用于大规模图像检索的深度哈希网络研究 [A] . 陈鹏飞 . 2020

用于语音检索的三联体深度哈希方法

摘要

著录项

相似文献

相关主题

期刊订阅