首页> 中文会议>第29届中国数据库学术会议 >列存储数据仓库中Hash连接改进算法研究

列存储数据仓库中Hash连接改进算法研究

摘要

Hash连接是一种高效的连接算法.然而由于难以提前选择合适的桶数和散列函数,降低了Hash连接效率.该问题在列存储海量数据查询连接中,表现尤为明显.提出了一种基于桶内索引的Hash连接改进算法.该算法当某些桶内出现数据大量聚集时,以消除重复值和构建桶内索引的方式,大大减少查找匹配时间.进而,根据列存储特点,提出列值有序数据下的散列与匹配算法,进一步提升桶内查找速度.所做的改进在SSB数据集的实验结果验证了其有效性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号