基于Web使用挖掘的网站结构优化技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

网站在构建时，主要依靠网站设计开发人员的手工设计和一些先验经验进行网站结构的组织，但是由于网站的设计开发人员与用户对网站结构组织存在着不同的理解，这种主观性的差异将会导致用户在搜索其感兴趣有益的网页时往往会以更多的访问代价达到目标网页。同时，用户在搜寻目标网页时，会产生一些无关的页面点击行为，这将大大增加服务器负荷和网络的数据流量，更易造成网络阻塞，导致网络访问速度的下降，从而影响用户对站点的满意度。也就说，目标网页的最优期望定位直接决定了站点的服务质量。
　　基于Web使用挖掘的网站结构优化技术就是通过挖掘Web日志，获得用户频繁访问路径，从而得到目标网页的最优定位，进而及时调整网站结构，使所有的用户都可以以很小的访问代价浏览站点，更有效地获取所需的信息。基于此，本文主要做了以下几个方面研究：
　　1)为了使Web挖掘算法能够在Web日志中进行挖掘，对Web日志数据预处理过程进行了详细讨论，探讨了如何将Web日志记录转换成用户会话，得到用户访问序列。
　　2)针对在海量数据情况下，单机进行数据预处理的效率将会愈来愈低的缺陷，提出一种基于 MapReduce的并行分布式处理办法，并将其在 Hadoop平台上进行了实现。
　　3)研究并分析了Web使用挖掘方面较为经典的关联规则算法及其特点，针对PLWAP算法在位置编码存在的缺陷，提出一种基于PLWAP算法改进的挖掘算法POCWAP算法，并结合IBM Quest Project数据进行实验，验证了其有效性与正确性，另外在与PLWAP算法的对比实验中，也直观反映出POCWAP在算法性能上较PLWAP算法有所提升。
　　4)采用改进的挖掘算法POCWAP算法，结合成都康赛信息技术有限公司企业网站的Web日志数据，设计并开发出一套网站结构优化原型系统WSOS。重点介绍了该系统的系统框架，以及在Hadoop平台上实现Web日志预处理过程，展示预处理结果和模式发现结果，给出改进意见，最后对原型系统进行功能测试与分析。
　　本文的最后给出了对全文工作的归纳和总结，探讨了下一步研究方向。

著录项

作者
刘明鸣;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科软件工程
授予学位硕士
导师姓名唐雪飞;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.09;TP311.13;
关键词
Web技术; 数据挖掘; 网站结构优化; WAP算法; 频繁序列模式;

相似文献

中文文献
外文文献
专利

1. 基于Web使用挖掘的资源网站优化 [J] . 潘大胜 . 百色学院学报 . 2009,第003期
2. 基于Web使用挖掘的网站优化服务研究 [J] . 王娟 . 计算机与现代化 . 2008,第009期
3. 基于WEB使用挖掘的网站个性化服务系统的设计 [J] . 范利星 ,张水平 ,张凤琴 . 计算机系统应用 . 2006,第001期
4. 基于Web使用挖掘技术的个性化教育网站构筑 [J] . 邢东山 ,沈钧毅 ,原野 . 计算机应用与软件 . 2002,第008期
5. 基于用户行为的Web使用挖掘数据采集技术研究 [J] . 向坚持 ,刘相滨 ,徐选华 . 计算机与现代化 . 2007,第012期
6. Web使用挖掘在医院信息网站建设中的应用研究 [C] . WANG Zhiyun ,汪志云 . 2014年华南医院信息网络大会 . 2014
7. 基于WEB使用挖掘的电子商务网站结构优化 [A] . 奚冬芹 . 2009

基于Web使用挖掘的网站结构优化技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅