首页> 中文期刊> 《软件学报》 >学习索引:现状与研究展望

学习索引:现状与研究展望

         

摘要

索引是数据库系统中用于提升数据存取性能的主要技术之一.在大数据时代,随着数据量的不断增长,传统索引(如B+树)的问题日益突出:(1)空间代价过高.例如,B+树索引需要借助O(n)规模的额外空间来索引原始的数据,这对于大数据环境而言是难以容忍的.(2)每次查询需要多次的间接搜索,例如,B+树中的每次查询都需要访问从树根到叶节点路径上的所有节点,这使得B+树的查找性能受限于数据规模.自2018年以来,人工智能与数据库领域的结合催生了“学习索引”这一新的研究方向.学习索引利用机器学习技术学习数据分布和查询负载特征,并用基于数据分布拟合函数的直接式查找代替传统的间接式索引查找,从而降低了索引的空间代价并提升了查询性能.首先对学习索引技术的现有工作进行了系统梳理和分类;然后,介绍了各种学习索引技术的研究动机与关键技术,对比分析了各种索引结构的优劣;最后,对学习索引的未来研究方向进行了展望.

著录项

  • 来源
    《软件学报》 |2021年第4期|1129-1150|共22页
  • 作者

    张洲; 金培权; 谢希科;

  • 作者单位

    中国科学技术大学计算机科学与技术学院 安徽合肥230026;

    电磁空间信息重点实验室(中国科学院) 安徽合肥230026;

    中国科学技术大学计算机科学与技术学院 安徽合肥230026;

    电磁空间信息重点实验室(中国科学院) 安徽合肥230026;

    中国科学技术大学计算机科学与技术学院 安徽合肥230026;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    数据库系统; 索引; 机器学习; 数据驱动;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号