文摘
英文文摘
声明
1绪论
1.1问题的提出及研究意义
1.1.1问题的提出
1.1.2研究的意义
1.2国内外研究现状
1.2.1搜索引擎的研究现状
1.2.2个性化服务研究现状
1.2.3个性化信息采集的研究现状
1.3本文研究的目的和研究内容
1.3.1论文研究目的
1.3.2论文研究内容
2个性化信息的获取
2.1引言
2.2显示信息的获取
2.3隐式信息的获取
2.3.1服务器日志分析法
2.3.2 Cookie
2.3.3点击流分析法
2.4相关兴趣度
2.4.1相关兴趣度的提出
2.4.2相关兴趣度的获取
2.5用户个性化信息模型
2.5.1用户模型的建模分类
2.5.2自定义的用户模型体系结构
2.5.3系统功能描述流程图
2.5.4用户模型的建立
2.5.5用户兴趣模型的更新
2.5.6返回结果的处理
2.6本章小结
3个性化信息采集系统及技术分析
3.1引言
3.2页面相关度判断
3.2.1根据元数据的判定
3.2.2基于Web页面内容的分析算法
3.2.3基于链接结构的分析
3.3采集策略选择
3.3.1盲目采集(Uninformed Search)
3.3.2启发式采集(Informed Search )
3.3.3并行采集(Parallel Search)
3.4个性化信息采集页面推荐技术
3.4.1向量空间(VSM)模型介绍
3.4.2个性化信息采集的推荐过程
3.4.3实验分析
3.5本章小结
4个性化信息采集性能优化
4.1引言
4.2相关度算法的改进
4.2.1基于链接的相关度算法的改进
4.2.2实验分析
4.3并行信息采集的研究
4.3.1并行采集模型
4.3.2 URL调度策略
4.3.3并行策略
4.3.4评估指标
4.3.5一种增量式并行Webcrawler模型
4.4页面刷新
4.4.1页面刷新策略
4.4.2增量式Web信息采集的页面刷新过程
4.5本章小结
5总结与展望
5.1主要结论
5.2后续研究工作的展望
致谢
参考文献
附录 作者在攻读学位期间发表的论文目录