首页> 外国专利> BUILDING OF A WEB CORPUS WITH THE HELP OF A REFERENCE WEB CRAWL

BUILDING OF A WEB CORPUS WITH THE HELP OF A REFERENCE WEB CRAWL

机译:建立具有参考网络草稿的网络公司

摘要

Computer-implemented method for building a web corpus (WCD) comprising thestepsof:- sending by a web crawler (WC) a query to a reference web crawl agent(RWCA), thisquery containing a least one identifier of a resource,- receiving by the web crawler (WC) a response from the reference web crawlagent(RWCA);- if this response does not contain the resource identified by theidentifier, downloadingby the web crawler (WC) the resource from the website (WS) corresponding totheidentifier and adding the resource to the web corpus (WCD; and- if this response contains the resource identified by the identifier,adding the resourceto the web corpus (WCD).
机译:建立网络语料库(WCD)的计算机实现方法,包括脚步的:-由网络爬虫(WC)发送查询到参考网络爬虫代理(RWCA),这个包含至少一个资源标识符的查询,-网络搜寻器(WC)接收来自参考网络搜寻的响应代理人(RWCA);-如果此响应不包含由标识符,下载由网络爬虫(WC)从网站(WS)对应的资源的标识符,并将资源添加到Web语料库(WCD);以及-如果此响应包含标识符标识的资源,添加资源网络语料库(WCD)。

著录项

  • 公开/公告号CA2812439A1

    专利类型

  • 公开/公告日2013-10-12

    原文格式PDF

  • 申请/专利权人 EXALEAD;

    申请/专利号CA20132812439

  • 申请日2013-04-12

  • 分类号G06F16/951;G06F16/953;H04L12/16;

  • 国家 CA

  • 入库时间 2022-08-21 16:38:00

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号