首页> 中文学位 >基于遗传算法进行高维数据聚类的新算法
【6h】

基于遗传算法进行高维数据聚类的新算法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究状况

1.3 论文的主要工作及创新

1.4 论文结构框架的安排

第二章 聚类分析及高维空间数据聚类概述

2.1 聚类分析

2.2 聚类分析的应用

2.3 高维空间数据聚类

第三章 优化算法概述

3.1 优化算法

3.2 遗传算法的基本描述

3.3 遗传算法的框架设计

3.4 蚁群算法的基本描述

3.5 粒子群算法的基本描述

3.6 遗传算法的特点

第四章 高维聚类算法NGAHD

4.1 NGAHD算法概述

4.2 编码与初始化

4.3 适应度评估函数的设计

4.4 遗传操作及其基本算子

4.5 迭代终止条件

4.6 实验对比与分析

第五章 结语

5.1 结论

5.2 研究探索

参考文献

致谢

攻读硕士学位期间作者参与的科研项目及成果

展开▼

摘要

数据挖掘,是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。它是一种透过数理模式来分析海量信息,找出不同的数据划分来提供决策支持的方法。
  数据挖掘是信息产业界最前沿的研究方向之一,而聚类分析则是数据挖掘的一项非常活跃的研究课题。聚类分析是将数据按照其相似度,划分成若干有意义的类或簇,同一类或簇中的数据相似度大相异度小,而不同类或簇间的数据相似度小相异度大。
  高维数据聚类是聚类分析中的重要课题。目前,低维数据的聚类算法已较为成熟。但是对于高维数据,由于其分布特性与低维情况相比有很大差异,使得许多在低维数据中通用的算法在高维数据中失效。因此对高维数据聚类算法的研究具有非常重要的意义。
  针对高维数据聚类问题,通常采取子空间聚类或全空间降维的方法来解决。
  论文提出了一种新的基于遗传算法的子空间聚类算法,用信息熵和距离评估子空间对聚类的贡献率作为适应度评估函数,适应度值直接决定了聚类结果的质量,它是评估聚类结果的依据,因此具有一定的理论价值。
  论文创新之处以及主要工作如下:
  (1)设计出了一种新的适应度评估函数,这是论文的重点和核心部分。用类内对象距离,类间中心点距离以及信息熵对特征子空间聚类的贡献率作为适应度评估函数,使得精确性和鲁棒性都得到了较大的提升。
  (2)遗传算法中染色体的编码和搜索空间的确定,编码空间设计为由特征选择子空间和类中心点空间两部分联合组成,由于实数编码的搜索空间更大且较为方便,论文采取实数编码方式。
  (3)通过人工数据和真实数据来验证论文算法的高效性与鲁棒性,同时与其他聚类算法作比较,评估算法的优劣。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号