文摘
英文文摘
致谢
第1章绪论
1.1研究背景
1.2信息抽取概述
1.2.1信息抽取定义
1.2.2信息抽取与信息检索
1.2.3信息抽取系统的评估标准
1.3半结构化数据
1.3.1半结构化数据的概念
1.3.2半结构化数据的特点
1.3.3半结构化数据的数据源
1.4本文工作内容
1.5本文组织结构
第2章Web信息抽取方法研究及比较
2.1自由格式文本的信息抽取
2.2结构、半结构文本的信息抽取
第3章基于HTML文档的信息抽取
3.1基于规范表式结构的信息抽取实现
3.2基于HTML标记树信息抽取实现
3.2.1抽取流程
3.2.2 HTML解析器
3.2.3样本页描述接口
3.2.4规则提取器
3.2.5抽取阶段
3.3小结
第4章基于XML文档的信息抽取
4.1数据模式简介
4.1.1 XML模式
4.1.2关系数据库及其模式
4.2 XML Schema到E/R的模式转换
4.3 XML Schema到E/R的转换的算法描述
4.3.1定义的数据结构
4.3.2程序流程
4.4小结
第5章总结和展望
5.1总结
5.2展望
攻读学位期间所做的工作
参考文献