您现在的位置：首页> 研究主题> 音频检索

音频检索

音频检索的相关文献在2000年到2022年内共计149篇，主要集中在自动化技术、计算机技术、无线电电子学、电信技术、信息与知识传播等领域，其中期刊论文83篇、会议论文12篇、专利文献53824篇；相关期刊63种，包括华章、情报杂志、现代情报等；相关会议10种，包括第九届全国有线电视技术研讨会、2007年全国网络与信息安全技术研讨会、第十二届国际广播电视技术讨论会(ISBT 2007)等；音频检索的相关文献由289位作者贡献，包括韩纪庆、郑贵滨、姚姗姗等。

音频检索—发文量

期刊论文>

论文：83篇占比：0.15%

会议论文>

论文：12篇占比：0.02%

专利文献>

论文：53824篇占比：99.82%

总计：53919篇

音频检索—发文趋势图

音频检索
-研究学者

韩纪庆
郑贵滨
姚姗姗
牛保宁
颜永红
刘加
唐峰
张卫强
张学帅
李应
李晓丽
李海峰
杜振龙
汤一博
潘云鹤
熊盛武
王辰龙
荣毅
路雄博
郑铁然
陈亚雄
丁丽
于丽娜
任广辉
何轶
冯慧
刘云玲
刘刚
刘文
刘晶
刘智满
刘玉贵
刘赵杰
刘轶
吕萍
吴丰博
吴静龙
吴飞
唐健琪
唐维康
姚仕元
姜涛
孔令城
宋越
庄越挺
张世磊
张健
张慧
张永
张琪浩

音频检索
-相关主题

音频检索
-相关期刊

音频检索
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(9)
2021
(10)
2020
(1)
2018
(6)
2017
(4)
2016
(6)
2015
(3)
2014
(3)
2013
(2)
2012
(4)
2011
(2)
2010
(3)
2009
(5)
2008
(8)
2007
(11)
2006
(6)
2005
(9)
2004
(3)
2003
(2)
2002
(1)
2001
(1)
2000
(1)

期刊

收录数据库

作者

韩纪庆
(9)
郑贵滨
(7)
姚姗姗
(6)
牛保宁
(6)
颜永红
(5)
刘加
(3)
唐峰
(3)
张卫强
(3)
张学帅
(3)
李应
(3)
李晓丽
(3)
李海峰
(3)
杜振龙
(3)
汤一博
(3)
潘云鹤
(3)
熊盛武
(3)
王辰龙
(3)
荣毅
(3)
路雄博
(3)
郑铁然
(3)
陈亚雄
(3)
丁丽
(2)
于丽娜
(2)
任广辉
(2)
何轶
(2)
冯慧
(2)
刘云玲
(2)
刘刚
(2)
刘文
(2)
刘晶
(2)
刘智满
(2)
刘玉贵
(2)
刘赵杰
(2)
刘轶
(2)
吕萍
(2)
吴丰博
(2)
吴静龙
(2)
吴飞
(2)
唐健琪
(2)
唐维康
(2)
姚仕元
(2)
姜涛
(2)
孔令城
(2)
宋越
(2)
庄越挺
(2)
张世磊
(2)
张健
(2)
张慧
(2)
张永
(2)
张琪浩
(2)

关键词

申请/权力人

;

1. 基于压缩域特征的多媒体数字音频检索方法
- 刘彦
- 摘要：多媒体数字音频具有海量性和复杂性的特点,因此为了提高多媒体数字音频检索的准确性和效率,提出基于压缩域特征的检索方法。通过均方根计算方式提取多媒体数字音频静态和动态特征,具体化音频特征信息。建立模糊集合,根据隶属度数值分析并融合其压缩域特征,获取最佳样本分类。采用三角模糊集算法建立偏斜度矩阵,分类压缩域特征完成多媒体数字音频检索。通过实验结果得出,以压缩域特征为基础完成多媒体数字音频检索。通过实验结果得出,基于压缩域特征的检索方法,提高了识别音频数据的准确率,同时检索时间较短。
2. 抗频率变换的采样计数音频检索方法
- 姚姗姗；牛保宁
- 摘要：理想的音频检索方法可以准确、高效地从大规模音频数据库中识别所有音频.但是,目前还没有一种方法可以对所有噪声干扰鲁棒.基于Philips指纹的采样计数音频检索方法是目前最高效的方法之一,如果能解决其无法抵抗线性变换(时间缩放、频率变换)的缺点,则整个采样计数音频检索方法将进一步趋于理想.针对其中的频率变换问题,提出抗频率变换的采样计数音频检索方法,包括变频带间隔的查询指纹生成方法、多频率尺度的查询匹配方法,以及分步骤指纹提取和变过滤阈值两种加速策略.该方法可以抵抗70％到130％的频率变换,效果与目前最好的QUAD方法相当,并且可以扩展到任意使用Philips类的指纹的检索方法以增强其抵抗频率变换干扰的能力.
3. 基于压缩感知和音频指纹的固定音频检索方法北大核心 CSCD CSTPCD
- 赵文兵；贾懋珅；王琪
- 摘要：针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题,本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法.在音频检索的训练阶段,首先,对样本音频信号进行稀疏化处理,并通过压缩感知算法对稀疏化后的音频数据进行压缩;其次,提取压缩信号的音频指纹;再次,引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维,最终得到检索特征库.在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论.实验结果表明,所提音频检索方法在确保较好的检索准确率的基础上,大幅度减小了样本音频数据库的存储量,提高了音频的检索速率.
4. 一种改进的Philips音频指纹检索算法An Improved Algorithm of Philips Audio Fingerprint Retrieval 北大核心 CSCD CSTPCD
- 孙宁；赵维平；陈美；李超
- 摘要：在Philips音频指纹检索算法中,构造一个查询表作为索引,由于内存消耗过大限制其广泛应用.为此,基于Philips音频指纹检索原型,提出一种改进算法.结合斐波那契数列和右移运算,构造新的哈希函数,通过斐波那契优化哈希值分布,并执行右移运算调整哈希表的长度.实验结果表明,改进算法能减少内存消耗,提高系统的实用性.%In the Philips audio fingerprint retrieval algorithm,the construction of a query table as an index,which limits the application due to excessive memory consumption.For this reason,an improved algorithm is proposed based on Philips audio fingerprint retrieval.Combining the Fibonacci number and the right shift operation,a new hash function is constructed.The distribution of hash value is optimized by Fibonacci.The length of the hash table is adjusted by performing the right shift operation.Experimental results show that the improved algorithm can reduce the memory consumption and improve the practicability of the system.
5. An Improved Method on Audio Fingerprinting Retrieval Algorithm一种音频指纹检索算法的改进方法
- 胡俊；李胥；陈毅
- 摘要：传统的Shazam音频指纹检索算法构造了一个倒排查询作为索引,但是索引的空间有限导致检索效率低,从而影响检索时间.基于Shazam算法,结合当今工程应用中储存空间越来越廉价的现状,提出了一种新的空间换时间的方法.在改进算法中,通过改变索引空间大小,提高了检索时间和提升了准确率.通过仿真实验分析,验证了该方法的有效性.
6. 音频信息检索综述
- 唐小宝
- 摘要：随着互联网和多媒体技术的迅猛发展,文本形式已无法满足人们的需求,多媒体数据的需求度正在不断增长.音频作为多媒体数据的重要组成成分,也发挥着越来越重要的作用.在大数据时代下,如何从海量音频数据中检索到所需的音频信息,是多媒体信息检索研究的重点问题之一.本文从音频信息检索的概念出发,介绍了音频信息检索的研究现状和主要技术手段,并简要分析了音频信息检索的不足之处,最后对音频信息检索的未来发展方向进行了预测.
7. 基于指纹权重的音频模板检索方法
- 张学帅12；邹学强23；胡琪1；张鹏远12
- 摘要：针对音频模板检索方法在噪音和频谱缺失等环境下鲁棒性不够强的问题,在原有Philips检索方法的基础上,提出了一种以帧能量差作为权重的检索方法,即充分利用原方法忽略的能量信息,通过对不同音频帧的DNA设置不同的匹配权重,有效提升了音频模板匹配方法的鲁棒性。实验结果表明,在受噪音影响和频谱缺失的数据集上,对于不同长度的音频模板,音频检索的查准率和查全率均有不同程度的提升,其中在2s的短模板上,查准率可比基线提高16%。
8. Audio retrieval method based on weighted DNA基于指纹权重的音频模板检索方法
- 张学帅；邹学强；胡琪；张鹏远
- 摘要： Aiming at the problem that the audio template retrieval method is not robust enough in the environment of noise and spectrum loss, a retrieval method based on the frame energy difference is proposed based on the traditional Philips retrieval method, in which the ignored energy information in the traditional method is used to effectively improve the robustness of the audio template matching method, by setting different matching weights on the DNA of different audio frames.The experimental results show that the accuracy of the audio search and the recall rate are improved under different lengths of audio templates on noise and spectrum missing data sets.For example, in the 2-second application environment, the precision rate is improved by 16％.%针对音频模板检索方法在噪音和频谱缺失等环境下鲁棒性不够强的问题,在原有Philips检索方法的基础上,提出了一种以帧能量差作为权重的检索方法,即充分利用原方法忽略的能量信息,通过对不同音频帧的DNA设置不同的匹配权重,有效提升了音频模板匹配方法的鲁棒性.实验结果表明,在受噪音影响和频谱缺失的数据集上,对于不同长度的音频模板,音频检索的查准率和查全率均有不同程度的提升,其中在2s的短模板上,查准率可比基线提高16％.
9. 基于多级索引的音频特征检索比对算法
- 叶循澹
- 摘要：本文通过对有声内容智能质检平台项目中音频检索涉及的哈希算法进行研究,在FNV哈希算法基础上,混合了位移、异或等算法的优点,提出了一种FNV混合哈希算法。并且通过对比分析表明,应用FNV混合哈希算法对有声内容智能质检项目中的音频进行特征提取和索引建立,能够有效提高音频重复内容的检出效率。
10. 基于音频指纹的两步固定音频检索Two-Stage Specific Audio Retrieval Based on Audio Fingerprinting 北大核心 CSCD CSTPCD
- 乔立能；夏秀渝；叶于林
- 摘要：提出了一种基于过零率和音频指纹的两步固定音频检索算法.在基于过零率直方图的初步检索中,采用直方图的迭代计算和动态的观测窗滑动步长来减少计算量并加快搜索速度,快速筛选出相似度较高的候选音频片段;接着基于降维Philips音频指纹对候选音频进行精检索,进一步提高检索精度.实验结果表明,该音频检索算法在保证较好的检索准确性基础上,大幅度提高了检索速度,且具有较好的鲁棒性.%This paper proposes a two-step fixed audio retrieval algorithm based on zero crossing rate and audio fingerprinting. The iterative calculation of the histogram and the sliding step of the observation time window are used in preliminary retrieval based on the zero crossing rate histogram to reduce the amount of calculation and speed up the search, fast filtering out candidate audio segments with high similarity; Then based on the dimension reduction Philips audio fingerprint, accurate retrieval of the candidate audio is carried out, further improving the retrieval accuracy. The experimental results show that the audio retrieval algorithm can improve the retrieval speed greatly and has good robustness, ensuring good retrieval accuracy.

1. 一种监控视音频信息的检索方法及检索系统
- 北京中盾安全技术开发公司
- 公安部第一研究所
- 公开公告日期：2015.05.06
- 摘要：本发明公开了一种监控视音频信息的检索方法及检索系统，该检索方法包括：获取所要检索事件发生时的时间点；比较欲检索时间点与视音频码流中的当前最接近绝对时间点，若欲检索时间点晚于当前最接近绝对时间点，则进行前向定位，同时生成索引文件；若欲检索时间点早于当前最接近绝对时间点，则进行后向定位；通过前向定位和后向定位得到早于欲检索时间点最近的绝对时间点；在得到的绝对时间点和下一个绝对时间点内进一步进行帧级定位，从而获得欲检索时间点的视音频监控信息。该检索方法充分利用了视音频文件中的绝对时间信息，可双向、快速、高精度的完成检索操作。
2. 一种基于音频内容检索的多媒体资源检索方法
- 叶睿智
- 公开公告日期：2009.12.02
- 摘要：本发明公开了一种基于音频内容检索的多媒体资源检索方法。包括如下步骤：1)预处理服务器将视频和音频转化为标准的待识别语音；2)语音识别服务器将训练语料训练成声学模型，并将待识别语音和声学模型匹配得到语意文本索引；3)索引服务器存储和组织关键词索引，并匹配检索条件得到检索结果。本发明利用音频中关键词检出技术，获得了音视频资源内在的语意信息，对文本化的语意信息进行索引，提供了更全面可靠的音视频资源信息索引，可以让检索系统更准确的匹配到多媒体资源，并且定位到检索词在音视频中出现的精确位置。
3. 一种基于音频数据的视频检索的装置及其视频检索方法
- 中国农业大学
- 公开公告日期：2016-10-26
- 摘要：本发明公开一种基于音频数据的视频检索的装置及其视频检索方法，装置包括：视频数据库模块，用于存储视频数据；第一音视频分离模块，用于分离视频数据库模块中视频数据的音频数据；音频数据库模块，用于存储第一音视频分离模块得到的音频数据；音视频数据接收模块，用于接收用户输入的音频或视频数据；第二音视频分离模块，用于在音视频数据接收模块接收到视频数据后，分离接收到的视频数据中的音频数据；音频数据匹配模块，用于将用户输入的音频数据或第二音视频分离模块得到的音频数据与音频数据库模块中的音频数据进行匹配，得到一个或多个目标音频数据；视频检索显示模块，用于将目标音频数据对应的目标视频数据向用户显示。
4. 一种实时音频指纹检索库数据更新和检索方法
- 杭州智屏软件有限公司
- 公开公告日期：2014-08-20
- 摘要：本发明公开了一种实时音频指纹检索库数据更新和检索方法，实时音频指纹检索库可实时地接收多路音频指纹流，多路音频指纹流每个指纹流中均包含成对的音频指纹、母本元信息，实时音频指纹检索库采用环形队列存储数据，环形队列包括头指针、尾指针、最大容量、当前数量信息，数据从队列的头部添加，每次成功添加数据，头指针往前移，尾指针和头指针之间的数据设为当前有效数据，检索时从队尾开始获取数据，多路音频指纹流每路指纹流数据存入时均设有过期时间，通过所述的尾指针移动使过期数据失效。本发明保证音频指纹数据的实时性，所有音频指纹数据均设有有效期，具备超时音频指纹数据自动删除功能。
5. 一种监控视音频信息的检索方法及检索系统
- 北京中盾安全技术开发公司
- 公安部第一研究所
- 公开公告日期：2012-06-27
- 摘要：本发明公开了一种监控视音频信息的检索方法及检索系统，该检索方法包括：获取所要检索事件发生时的时间点；比较欲检索时间点与视音频码流中的当前最接近绝对时间点，若欲检索时间点晚于当前最接近绝对时间点，则进行前向定位，同时生成索引文件；若欲检索时间点早于当前最接近绝对时间点，则进行后向定位；通过前向定位和后向定位得到早于欲检索时间点最近的绝对时间点；在得到的绝对时间点和下一个绝对时间点内进一步进行帧级定位，从而获得欲检索时间点的视音频监控信息。该检索方法充分利用了视音频文件中的绝对时间信息，可双向、快速、高精度的完成检索操作。
6. 一种基于音频内容检索的多媒体资源检索方法
- 叶睿智
- 公开公告日期：2008-10-08
- 摘要：本发明公开了一种基于音频内容检索的多媒体资源检索方法。包括如下步骤：1)预处理服务器将视频和音频转化为标准的待识别语音；2)语音识别服务器将训练语料训练成声学模型，并将待识别语音和声学模型匹配得到语意文本索引；3)索引服务器存储和组织关键词索引，并匹配检索条件得到检索结果。本发明利用音频中关键词检出技术，获得了音视频资源内在的语意信息，对文本化的语意信息进行索引，提供了更全面可靠的音视频资源信息索引，可以让检索系统更准确的匹配到多媒体资源，并且定位到检索词在音视频中出现的精确位置。
7. 通过文字输入的音频文件检索装置以及检索方法
- 乐金电子(惠州)有限公司
- 公开公告日期：2004-10-06
- 摘要：一种通过文字输入来检索所需要的音频文件的音频文件检索装置以及检索方法。本发明的检索方法包括：第一阶段，从插入装置的光盘中检索并储存对各个音频文件的音频文件信息；第二阶段，用户要求时，输出检索音频文件的文字输入窗口；第三阶段，在上述文字输入窗口中输入文字时，根据检索并储存的音频文件信息检索出相应于所输入文字的音频文件；第四阶段，根据检索出的音频文件信息，将检索出的音频文件从光盘中检索出并播放。利用记录在光盘上的各MP3音频文件的音频文件信息，将相应于所输入文字的音频文件，迅速检索出并播放，因此为用户提供便利性以及提高了装置的效率。
8. 音频子指纹的检索方法、装置以及音频查询系统
- 阿里巴巴集团控股有限公司
- 公开公告日期：2019-02-26
- 摘要：本申请提供一种检索方法，包括：获得待检索的音频子指纹；根据所述音频子指纹，在预先生成的地址索引表中读取与所述音频子指纹对应的索引条目中记录的倒排项首地址；根据所述倒排项首地址，在预先生成的倒排表中，读取对应所述音频子指纹的倒排项条目，获得该条目下记录的各个音频标识符ID；根据所述音频标识符ID，通过预先生成的音频标识符ID‑音频指纹库地址映射表，获得各个音频标识符ID对应的音频指纹文件在音频指纹库中的存放地址。本申请提供的音频子指纹的检索方法借鉴了文本检索中的倒排表方式，可以快速获得包含音频子指纹的音频标识符ID。本申请同时提供一种识别音频文件的检索方法，以及一种音频查询系统。
9. 一种基于音频指纹的分片音频检索方法
- 湖南大学
- 公开公告日期：2020.07.14
- 摘要：本申请发明针对现有技术在音频检索中准确性和快速性不能兼得的缺点，公开了一种基于音频指纹的分段音频检索方法。该方法包括：步骤1，对待检音频片段进行音频长度检测及判断，判断长度是否大于N秒，否则进入步骤2，是则对音频片段分成N秒和剩余音频片段；步骤2，对步骤1的音频片段进行数字化、预处理，主要包括预滤波、采样、预加重、加窗分帧；步骤3，对步骤2的音频信号提取音频指纹特征；步骤4，和音频指纹特征库进行特征匹配，判断最大匹配率是否大于阈值，是的话，返回原始音频信息，检索结束，否的话利用音频分片再提取指纹以及指纹匹配。本方法先对待检音频片段进行分片，并逐片进行特征提取和特征匹配，并对音频指纹特征进行优化，所以相比现有技术，本发明能大幅度提高音频检索的准确率和效率。
10. 音频指纹提取和建库方法、及音频识别和检索方法与系统
- 阿里巴巴集团控股有限公司
- 公开公告日期：2021-07-16
- 摘要：公开了一种音频指纹提取和建库方法，以及相应的身份识别以及音频检索方法和系统。该音频指纹提取方法，包括：获取音频的频谱；基于频谱内参考峰值点与其他峰值点的频率时间关系，生成峰值点对；基于峰值点对生成所述音频的音频指纹。音频指纹可以包括常规指纹、旋律指纹、伴奏指纹以及旋律伴奏联合指纹。提取的音频指纹可以用于音频身份识别和音频检索库的建立，以方便对待定或查询音频的身份判定。

音频检索

音频检索—发文量

音频检索—发文趋势图

音频检索-研究学者

音频检索-相关主题

音频检索-相关期刊

音频检索-相关会议

音频检索
-研究学者

音频检索
-相关主题

音频检索
-相关期刊

音频检索
-相关会议