基于XML的Web数据抽取研究

吕锋; 余丽

首页> 中文期刊> 《计算机技术与发展》 >基于XML的Web数据抽取研究

基于XML的Web数据抽取研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法.重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档.实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件.

著录项

来源
《计算机技术与发展》 |2007年第6期|53-55|共3页
作者
吕锋; 余丽;
展开▼
作者单位

武汉理工大学;

湖北;

武汉;

430070;

武汉理工大学;

湖北;

武汉;

430070;

展开▼
原文格式 PDF
正文语种 chi
中图分类数据收集和处理系统;
关键词
XML; Web; 数据抽取;

相似文献

中文文献
外文文献
专利

1. 基于XML的WEB数据抽取模型研究 [J] . 黄淑芹 . 通化师范学院学报 . 2012,第002期
2. 基于 XML的Web数据抽取模型研究 [J] . 谢维成 ,吕先竞 ,宋玉忠 . 西华大学学报（自然科学版） . 2006,第001期
3. 基于XML的Web数据抽取方法的研究 [J] . 尚福华 ,孙丽 . 黑龙江工程学院学报（自然科学版） . 2004,第001期
4. 一种基于XML的Web数据抽取的实现 [J] . 李雪竹 . 科学技术与工程 . 2008,第009期
5. XML在Web数据抽取中的应用研究 [J] . 王艳 ,刘双红 ,罗慧敏 . 郑州航空工业管理学院学报（社会科学版） . 2005,第004期
6. 基于领域模型的Web数据抽取与集成 [C] . LI Gui ,李贵 ,ZHANG Miao . 2012年江苏省计算机学会网络与分布计算专委会和网格与服务计算专委会联合学术年会 . 2012
7. 基于XML的web数据抽取研究 [A] . 余丽 . 2007

基于XML的Web数据抽取研究

摘要

著录项

相似文献

相关主题

期刊订阅