首页> 外文会议>British National Conference on Databases(BNCOD 23); 20060718-23; Belfast(GB) >The Lixto Project: Exploring New Frontiers of Web Data Extraction
【24h】

The Lixto Project: Exploring New Frontiers of Web Data Extraction

机译:Lixto项目:探索Web数据提取的新领域

获取原文
获取原文并翻译 | 示例

摘要

The Lixto project is an ongoing research effort in the area of Web data extraction. Whereas the project originally started out with the idea to develop a logic-based extraction language and a tool to visually define extraction programs from sample Web pages, the scope of the project has been extended over time. Today, new issues such as employing learning algorithms for the definition of extraction programs, automatically extracting data from Web pages featuring a table-centric visual appearance, and extracting from alternative document formats such as PDF are being investigated.
机译:Lixto项目是Web数据提取领域中一项正在进行的研究工作。尽管该项目最初的想法是开发一种基于逻辑的提取语言和一种工具,以可视方式从示例Web页面中定义提取程序,但随着时间的推移,该项目的范围得到了扩展。如今,正在研究新问题,例如采用学习算法定义提取程序,从具有以表格为中心的视觉外观的网页自动提取数据以及从其他文档格式(例如PDF)提取数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号