分布式环境下重叠分块FM-index算法的设计

摘要

随着网络和数据库发展,数据急剧增长,对信息检索提出了挑战。压缩查询技术实现了在压缩状态下查询文件,其中压缩查询索引FM-index是该领域的一种先进的算法。但FM-index在建立索引时却要消耗很大的内存。而重叠分块FM-index方法在内存空间的占用上得到了改进,但是对于GB级以上的数据,性能上还需进一步改进。以重叠分块的FM-index和网格计算技术为基础,通过对参数及结果传递的各种方案比较,结合重叠分块FM-index和网格计算的特点,给出了设计并具体实现算法,同时分析了性能的改进。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号