基于Web的用户个性化信息采集技术分析

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Internet的飞速发展和万维网(WWW)的日益庞大，Web资源的复杂程度更是以指数级的数量增长，导致人们在查找所需信息时不知所措。为了解决“信息过载”和“资源迷向”的问题，搜索引擎出现了。现今的搜索引擎往往具有通用性，排序机制中又没有考虑到用户的偏好，因而很难满足不同背景、不同目的的用户需求。个性化Web信息采集就是针对这个问题而提出来的。个性化Web信息采集的研究目标在于充分利用用户的个性化信息，通过用户兴趣制导或与用户交互等灵活手段来采集Web信息，充分利用网络信息，以更好地服务于用户的个性化需求。
　　首先，介绍了个性化Web信息采集的研究背景和意义，个性化技术和Web信息采集的研究现状；
　　其次，用户兴趣个性化信息的获取。分析了用户兴趣个性化显示和隐式信息的收集，介绍了个性化搜索引擎中有关用户建模的关键技术，提出了一种新的用户建模方法，即把手工定制建模和自动用户建模结合起来，根据用户的浏览行为引入了“相关兴趣度”，用来表示用户对页面感兴趣的程度，并更新用户兴趣模型。
　　再次，介绍了个性化信息采集的流程，以及对采集结果相关度的常用算法。详细介绍了PageRank算法和HITS算法的核心技术，指出了PageRank算法忽视专业站点、对网页中的超链接评估不当之处。最后介绍了采集器使用多线程采集页面，提出常见的3种采集策略的介绍。
　　最后，个性化Web信息采集的性能优化。分别从基于链接的相关度算法的改进、采用并行系统进行采集，页面刷新来实现。在相关度算法上，引入了面向主题的思想，重新计算连接关系对页面权重的影响的前提下，提出了一种新的基于链接分析的结果排序算法，有利于提高查询的精度。且提出多线程的增量式Web信息采集架构，提高采集效率同时，来解决并行采集中的网页消重、页面优化、内存不足等问题。且采用增量式信息采集进行页面刷新。

著录项

作者
高灵霞;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科计算机应用技术
授予学位硕士
导师姓名何中市;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;TP311.13;
关键词
Web用户; 个性化信息采集; 信息过载; 搜索引擎;

相似文献

中文文献
外文文献
专利

1. 基于Web3.0的网络用户个性化信息聚合算法研究 [J] . 龙勇 . 软件导刊 . 2016,第006期
2. 基于Web3.0的网络用户个性化信息聚合算法研究 [J] . 龙勇 . 软件导刊 . 2016,第006期
3. 基于Web2.0用户个性化推荐系统分析 [J] . 连雁平 . 佛山科学技术学院学报（自然科学版） . 2014,第001期
4. 基于Web浏览的高校图书馆用户个性化研究 [J] . 黄镇圣 . 科技信息 . 2009,第012期
5. 基于Web浏览的高校图书馆用户个性化研究 [J] . 黄镇圣 . 科技信息 . 2009,第12X期
6. 基于Web挖掘的个性化信息服务中的用户研究 [C] . 教巍巍 . 第三届国际信息技术与管理科学学术研讨会 . 2011
7. 基于用户个性化的Web信息采集技术研究 [A] . 刘彤 . 2004

基于Web的用户个性化信息采集技术分析

目录

摘要

著录项

相似文献

相关主题

期刊订阅