首页> 中文期刊> 《计算机研究与发展》 >主题爬行中的隧道穿越技术

主题爬行中的隧道穿越技术

         

摘要

由于网络环境的复杂性和网页内容的多主题性,要想得到更多的特定主题相关网页,就要穿越那些主题不相关网页来获取更多的主题相关网页,即隧道穿越.将隧道穿越分为灰色隧道穿越和黑色隧道穿越.对于灰色隧道,在爬行过程中,将一个多主题Web页面分割成数量不多的内容块分别处理来避免由于网页整体主题不相关给该块所带来的影响.对于黑色隧道的穿越,将隧道中主题不相关网页根据其父亲页面的主题相关性赋予一个深度值,然后根据其深度值的大小进行取舍,来达到扩展主题爬行区域的目的.实验结果显示,这两种方法都达到了预期效果,所以方法是有效、稳健和实用的.

著录项

  • 来源
    《计算机研究与发展》 |2010年第4期|628-637|共10页
  • 作者单位

    吉林大学计算机科学与技术学院;

    长春;

    130012;

    符号计算与知识工程教育部重点实验室(吉林大学);

    长春;

    130012;

    北京科技大学土木与环境工程学院;

    北京;

    100083;

    吉林大学计算机科学与技术学院;

    长春;

    130012;

    符号计算与知识工程教育部重点实验室(吉林大学);

    长春;

    130012;

    吉林大学计算机科学与技术学院;

    长春;

    130012;

    符号计算与知识工程教育部重点实验室(吉林大学);

    长春;

    130012;

    吉林大学计算机科学与技术学院;

    长春;

    130012;

    符号计算与知识工程教育部重点实验室(吉林大学);

    长春;

    130012;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    主题爬行; 灰色隧道穿越; 黑色隧道穿越; 网页分块; target length;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号