文摘
英文文摘
原创性声明及使用授权说明
第1章绪论
1.1研究背景
1.2个性化网络信息获取技术的研究现状
1.3本文的研究意义
1.4本文的研究内容
第2章系统需求分析和总体设计
2.1基于示例的中文Web信息自动获取系统的定义
2.2系统需求分析
2.3系统总体设计
第3章基于示例的用户信息需求模型的建立
3.1中文Web页面的特征抽取
3.2 Web页面解析
3.3串频统计和词形匹配相结合的汉语自动分词方法
3.4基于少量中文正例Web页面的特征抽取方法
第4章待过滤Web信息源的采集
4.1 Web信息采集系统基本原理
4.2 Web信息采集面临的问题
4.3 Web信息采集方式
4.4基于元搜索的待过滤Web信息源的采集
第5章中文Web页面的过滤
5.1文本过滤与文本分类、文本检索的关系
5.2文本过滤的主要方法
5.3网页过滤器设计
5.4过滤阈值的设定
第6章系统实现
6.1系统技术方案
6.2系统开发平台
6.3数据库设计
6.4客户端的实现
6.5兴趣管理器的实现
6.6元搜索采集器的实现
6.7网页过滤器的实现
6.8系统的检全率和检准率
结束语
致谢
参考文献
攻读硕士学位期间发表的学术论文