首页> 外文期刊>電子情報通信学会技術研究報告 >特徴選択に基づく Locality-Sensitive Hashingによる高次元データの高速類似検索方法
【24h】

特徴選択に基づく Locality-Sensitive Hashingによる高次元データの高速類似検索方法

机译:基于特征选择的局部敏感哈希的高维数据快速相似度搜索方法

获取原文
获取原文并翻译 | 示例
           

摘要

This paper proposes a method for locality-sensitive hashing with margin based feature selection for large-scale, high dimension data. The basic concept is to generate a hash function and importance for selection that targets a much larger size than the final targeted bits, and to select the importance in descending order until the final targeted bits are reached. The new algorithm was applied to biometric, speech, ana image datasets and compared with other methods, and the effects for each data application were verified.%ハミング距離による高速な類似度計算が可能なLocality-Sensitive Hashingにおいて、目標よりも多数の超平面(ビット)の重要度を評価し、重要度が高い順に目標ビット数になるまで選択を行う方法を提案する。提案方法が、指紋画像データなど数千次元を超える特徴量で、同ラベルとなるデータが極端に少ない場合でも最適化が有効に行われることを示すと共に、音声特徴量、手書き文字画像データに対しても効果を確認した。
机译:本文针对大规模,高维数据,提出了一种基于边缘的,基于余量的特征选择的局域性哈希算法,其基本概念是生成哈希函数及其重要性,其目标大小要比最终目标比特大得多,并且将该新算法应用于生物识别,语音,模拟图像数据集,并与其他方法进行了比较,并验证了每种数据应用的效果。由于汉明距离的影响,%高速以降序选择重要性,直到达到最终目标比特为止。在可以计算相似性的局部敏感哈希中,我们提出了一种方法,该方法评估比目标更多的超平面(位)的重要性,并按重要性递增的顺序进行选择,直到达到目标位数为止。所提出的方法表明,即使具有相同标签的数据极小且具有超过数千维的特征,例如指纹图像数据,也可以有效地执行优化。但是我确认了效果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号