首页> 中文期刊> 《电脑知识与技术》 >基于网页的语料库自动生成

基于网页的语料库自动生成

         

摘要

网页文本信息的抽取是网络信息搜索的重要组成部分,通过网页文本抽取生成完备精简的语料库对网页信息的分析起着至关重要的作用.目前网页解析的技术有很多,常用的技术有基于正则表达式的静态网页文本抽取,基于HTML文件流分析的静态文本解析,基于DOM树的动态网页分析和基于SAX的动态网页分析.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号