首页> 中文学位 >基于粒子群的聚类算法改进及其在访问模式中的应用研究
【6h】

基于粒子群的聚类算法改进及其在访问模式中的应用研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1选题背景与研究意义

1.2 Web数据挖掘研究现状

1.2.1 Web数据特点

1.2.2 Web数据挖掘分类

1.3结构安排及创新点

第二章 相关技术及理论介绍

2.1数据挖掘相关技术及理论介绍

2.1.1关联规则

2.1.2序列模式

2.1.3分类分析

2.1.4聚类分析

2.2群集智能的研究

2.2.1遗传算法

2.2.2蚁群算法

2.2.3粒子群算法

2.2.4粒子群与遗传算法比较

2.2.5群智能的特点和优点

2.3 Web访问模式挖掘的聚类相关理论

2.3.1聚类分析常用方法

2.3.2聚类算法的典型要求

2.3.3聚类算法的数据类型

2.3.4 K-均值算法

2.3.5 Web访问模式挖掘的聚类算法

第三章 基于粒子群改进的聚类算法

3.1粒子群算法的概念

3.1.1基本思想及背景

3.1.2算法描述

3.13参数选择

3.2粒子群相关理论发展

3.2.1粒子群参数的优化

3.2.2粒子群拓扑结构改进

3.2.3混合PSO

3.2.4离散PSO

3.3粒子群的应用方向

3.4粒子群的聚类算法

3.5粒子群与K-均值混合聚类算法

3.5.1粒子群与K-均值混合聚类算法研究现状

3.5.2观点验证

3.6基于搜索方向改进的RVPSO-K聚类算法

3.6.1问题提出

3.6.2 RVPSO-K聚类算法相关定义

3.6.3 RVPSO-K聚类算法基本流程

3.6.4算法参数选择

3.7实验

3.7.1实验一

3.7.2实验二

3.7.3实验三

3.7.4结论

第四章 RVPSO-K聚类算法在Web访问模式中的应用

4.1 Web访问模式挖掘研究及应用

4.2 Web访问模式挖掘的数据预处理

4.2.1日志数据

4.2.2数据清洗

4.2.3用户识别

4.2.4会话识别

4.2.5路径完善

4.2.6事务识别

4.3 Web访问模式挖掘聚类中的RVPSO-K算法实现

4.3.1 UserID-URL关联矩阵构建

4.3.2相似性度量

4.3.3 RVPSO-K的算法流程

4.3.4具体算法实现说明

4.4仿真实验

4.4.1仿真实验数据

4.4.2仿真实验结果

第五章 结束语

5.1工作总结

5.2存在的问题及展望

参考文献

发表论文和科研情况说明

致 谢

展开▼

摘要

从大量顾客日志数据中挖掘有意义的用户访问模式及相关的潜在顾客群,是目前数据挖掘技术在Internet上的重要应用之一,挖掘用户访问网站的模式,可以使网站建设者清楚地了解自己网站不同用户的兴趣和整个网站页面的访问情况,并可进一步优化网站的组织结构或建立自适应网站,从而从中发现商机并方便不同用户的访问。由于现实需求的急迫,越来越多的研究者将目光对准了这个领域,使得Web访问模式挖掘技术得到很快的发展,本论文正是在这样的背景下对用户访问模式聚类算法进行了研究。 本文通过分析Web数据特点及现有聚类算法,得出用户访问模式聚类的特点,提出将粒子群优化算法与K-均值相结合应用于Web访问模式聚类的可能。 通过分析K-均值算法与粒子群优化算法(Particle Swarm Optimization,PSO),对现有的几种基于粒子群的K-均值聚类算法进行了实验验证,并根据粒子群算法在数据分析应用中的不足,提出了一种基于随机搜索方向的K-均值与粒子群算法结合的聚类算法RVPSO-K,它能够通过改变粒子轨迹提高粒子本身的搜索能力,从而可能尽快地找到全局最优解。经lris、Zoo、Wine数据集对K-均值算法、粒子群算法及相关的4种改进算法进行测试,结果表明,RVPSO-K算法聚类能力较强,收敛性较好。 RVPSO-K算法应用于用户访问模式时,本文详细地分析了预处理阶段的各项任务,构造了本文算法所适用的UserID-URL关联矩阵,对聚类中心代表含义进行了说明,提出设定不同的阈值的概念来解决用户后续推荐问题,从而提高调控推荐网页的数量的灵活性,满足不同的推荐需求。实验结果表明,在大量及高维度的用户数据情况下,与其他改进算法对比,RVPSO-K算法具有较强的搜索能力和较好稳定性,且精度较好,速度有明显提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号