基于XML的网页信息提取系统的研究与设计

杨成

首页> 中文期刊> 《电脑知识与技术》 >基于XML的网页信息提取系统的研究与设计

基于XML的网页信息提取系统的研究与设计

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

该文提出了一种面向由XML描述的Web文档的基于用户主题信息的模式和数据抽取方法,它利用学习算法从样本文档中提取规则,然后使用匹配算法从目标文档中抽取出数据。该文使用一种改进的解析方法对XML文档进行解析,在模式抽取时使用了顺序覆盖算法从样本XML文档集中训练出模式。在数据抽取算法中,数据抽取算法从解析后的XML文档树中寻找用户所需的信息,它可以高效、准确地找到用户所需数据。

著录项

来源
《电脑知识与技术》 |2009年第26期|7327-7329|共3页
作者
杨成;
展开▼
作者单位

上海交通大学;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
XML; 数据抽取; 文档解析;

相似文献

中文文献
外文文献
专利

1. 基于XML的网页信息提取系统的研究与设计 [J] . 杨成 . 电脑知识与技术 . 2009,第9x期
2. 基于XML的网页安全防护系统设计 [J] . 李必云 ,石俊峰 . 计算机时代 . 2010,第4期
3. 基于XML的机械产品设计系统的设计与研究 [J] . 陈桦 ,韩艳艳 . 精密制造与自动化 . 2007,第4期
4. 基于动线分析和系统布局设计法的手机购物网页设计研究 [J] . 袁玉娇 ,叶春明 ,孙军华 . 人类工效学 . 2016,第1期
5. 基于XML的简易运动员信息管理系统的设计与实现研究 [J] . 戈俊 ,王莉莉 . 体育科技文献通报 . 2023,第5期
6. 基于单层扁平结构的XML网页信息抽取系统的研究与初步实现 [C] . 火善栋 ,朱南丽 ,黄青松 . 2005年昆明理工大学研究生学术交流年会 . 2005
7. 基于XML的WEB数据库数据发布及信息提取系统的设计与实现 [A] . 张诗军 . 2003

基于XML的网页信息提取系统的研究与设计

摘要

著录项

相似文献

相关主题

期刊订阅