首页> 中文期刊> 《北京信息科技大学学报(自然科学版)》 >面向分布式网络爬虫的域名解析方法研究

面向分布式网络爬虫的域名解析方法研究

         

摘要

提出了一种分布式JVM(Java Virtual Machine)网络爬虫的域名解析缓存方法DQ Cache(Distributed Quick Cache),实现了高效的DNS缓存机制.在深入分析操作系统和JVM的域名解析工作机制基础上,结合分布式爬虫的并行化与任务多节点均匀化等特点,采用正向和负向双缓存方式,为2个缓存分别设计采用了特定的数据结构和过期策略.实验表明,该方法可以有效提升域名解析性能,同时降低各爬虫节点的内存占用和域名解析请求对网络带宽的影响,提升了分布式爬虫的整体性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号