首页> 中文会议>第二十三届中国数据库学术会议(NDBC2006) >数据流滑动窗口连接上的卸载技术的研究

数据流滑动窗口连接上的卸载技术的研究

摘要

数据流的应用,例如网络监测、在线实时交易分析、入侵检测、传感器网络等为现有的传统数据库系统带来了很大挑战.与以往固定容量的数据集不同,无界且连续的数据流需要特殊的处理技术.在数据流处理领域的研究已经取得了可观的进展.比较著名的数据流系统有Aurora,STREAM,NiagaraCQ以及TelegraphCQ. 对于处理连接(join)这一常用的操作符来说,由于流的无界性,将一个流中的每个元组和另一个流中的每个元组一一比对是不可行的,因而引入了滑动窗口技术,即用一个有容量限制的窗口将参与连接的元组限制在最新的一系列元组中,得到用户可接受的近似连接结果.滑动窗口主要有两种形式:基于时间的窗口及基于元组的窗口.本文重点考虑基于元组的窗口.需要注意的是即使引入滑动窗口,对连接操作符的处理仍有可能造成CPU及内存资源的不足.因此在这种情况下有必要对数据流进行卸载,即抛弃数据流中的部分元组以降低系统的负载,从而加快连接操作的处理速度,保持系统与不断更新的数据流同步,不致产生因等待而出现的查询质量变差的情况. 本文提出了一种新的卸载策略以使过载数据流上的滑动窗口连接操作可以输出最大子集结果.通过双窗口模型和辅助窗口上的统计信息,我们可以对近期元组的连接结果进行预测,并通过后端卸载实现元组的语义选择.当流速过快时,又引入前端卸载,通过这种前后端卸载相结合的策略能够有效的实现过载状况下的连接结果输出最大化。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号