基于遗传算法进行高维数据聚类的新算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘,是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。它是一种透过数理模式来分析海量信息,找出不同的数据划分来提供决策支持的方法。
　　数据挖掘是信息产业界最前沿的研究方向之一,而聚类分析则是数据挖掘的一项非常活跃的研究课题。聚类分析是将数据按照其相似度,划分成若干有意义的类或簇,同一类或簇中的数据相似度大相异度小,而不同类或簇间的数据相似度小相异度大。
　　高维数据聚类是聚类分析中的重要课题。目前,低维数据的聚类算法已较为成熟。但是对于高维数据,由于其分布特性与低维情况相比有很大差异,使得许多在低维数据中通用的算法在高维数据中失效。因此对高维数据聚类算法的研究具有非常重要的意义。
　　针对高维数据聚类问题,通常采取子空间聚类或全空间降维的方法来解决。
　　论文提出了一种新的基于遗传算法的子空间聚类算法,用信息熵和距离评估子空间对聚类的贡献率作为适应度评估函数,适应度值直接决定了聚类结果的质量,它是评估聚类结果的依据,因此具有一定的理论价值。
　　论文创新之处以及主要工作如下:
　　(1)设计出了一种新的适应度评估函数,这是论文的重点和核心部分。用类内对象距离,类间中心点距离以及信息熵对特征子空间聚类的贡献率作为适应度评估函数,使得精确性和鲁棒性都得到了较大的提升。
　　(2)遗传算法中染色体的编码和搜索空间的确定,编码空间设计为由特征选择子空间和类中心点空间两部分联合组成,由于实数编码的搜索空间更大且较为方便,论文采取实数编码方式。
　　(3)通过人工数据和真实数据来验证论文算法的高效性与鲁棒性,同时与其他聚类算法作比较,评估算法的优劣。

著录项

作者
王志飞;
展开▼
作者单位

汕头大学;

展开▼
授予单位汕头大学;
学科计算机应用技术
授予学位硕士
导师姓名孙浩军;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
数据挖掘; 高维数据; 聚类分析; 遗传算法; 特征子空间;

相似文献

中文文献
外文文献
专利

1. 一种高维数据聚类遗传算法 [J] . 孙浩军 ,熊琅环 . 计算机工程与科学 . 2010,第008期
2. 新的降维标准下的高维数据聚类算法 [J] . 万静 ,吴凡 ,何云斌 . 计算机科学与探索 . 2020,第1期
3. 一种新的高维数据聚类自适应算法的研究 [J] . 余元辉 ,邓莹 . 沈阳化工大学学报 . 2010,第002期
4. 一种新的高维数据聚类自适应算法的研究 [J] . 余元辉 ,邓莹 . 沈阳化工大学学报 . 2010,第002期
5. 采用适应性遗传算法进行数据聚类的研究 [J] . 陈庆章 ,韩江洪 ,张维一 . 南京大学学报：自然科学版 . 2005,第z1期
6. 采用适应性遗传算法进行数据聚类的研究 [C] . 陈庆章 ,合肥工业大学 ,韩江洪 . 2005’全国软件与应用学术会议（NASAC） . 2005
7. 基于遗传算法的高维数据聚类研究 [A] . 熊琅环 . 2011

基于遗传算法进行高维数据聚类的新算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅