首页> 中文期刊> 《软件学报》 >基于页面Block的Web档案采集和存储

基于页面Block的Web档案采集和存储

         

摘要

提出了基于页面Block对Web页面的采集和存储方式,并详细表述了该方法如何完成基于布局页面分区、Block主题的抽取、版本和差异的比较以及增量存储的方式.实现了一个Web归档原型系统,并对所提出的算法进行了详细的测试.理论和实验表明,所提出的基于页面Block的Web档案(Web archive)采集和存储方法能够很好地适应Web档案的管理方式,并对基于Web档案的查询、搜索、知识发现和数据挖掘等应用提供有利的数据资源.

著录项

  • 来源
    《软件学报》 |2008年第2期|275-290|共16页
  • 作者单位

    东北大学;

    信息科学与工程学院;

    辽宁;

    沈阳;

    100004;

    东北大学;

    信息科学与工程学院;

    辽宁;

    沈阳;

    100004;

    东北大学;

    信息科学与工程学院;

    辽宁;

    沈阳;

    100004;

    东北大学;

    信息科学与工程学院;

    辽宁;

    沈阳;

    100004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 计算机网络;
  • 关键词

    Web档案; 页面分区; 页块;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号