基于密度优化初始聚类中心的K-means算法

王艳娥; 安健; 梁艳; 康晶晶

首页> 中文期刊> 《计算机技术与发展》 >基于密度优化初始聚类中心的K-means算法

基于密度优化初始聚类中心的K-means算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对K-means算法随机选择初始聚类中心,对噪音和异常点比较敏感,聚类结果过多依赖于专家经验从而缺乏一定客观性的问题,提出一种新的度量样本密度的方法优化K-means算法对初始聚类中心的选择.该方法基于样本实际分布,以最优超球体中样本个数与超球体中样本相似性作为度量样本密度的关键,能够有效选出较优的聚类中心,使得选择的初始聚类中心更接近样本集的实际分布.算法在乳腺癌数据集、常用UCI数据集以及人工模拟数据集上进行测试,实验结果表明,与已有同类方法相比,该算法在各数据集上的聚类评价指标均有提高,而且运行速度更快,聚类结果更稳定,聚类准确率更高:在乳腺癌数据集wdbc上的准确率为91.04％,提高了6％.在Iris数据集上的准确率为94％,提高了5％.

著录项

来源
《计算机技术与发展》 |2020年第12期|99-105|共7页
作者
王艳娥; 安健; 梁艳; 康晶晶;
展开▼
作者单位

西安思源学院理工学院陕西西安 710038;

西安交通大学深圳研究院广东深圳 518057;

西安思源学院理工学院陕西西安 710038;

山西农业大学信息学院山西晋中 030800;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
K-means算法; 密度; 去噪; 最优超球体; 均方差; 噪声数据;

相似文献

中文文献
外文文献
专利

1. 基于密度的优化初始聚类中心K-means算法研究 [J] . 何佳知 ,谢颖华 . 微型机与应用 . 2015,第019期
2. 基于平均密度优化初始聚类中心的k-means算法 [J] . 邢长征 ,谷浩 . 计算机工程与应用 . 2014,第020期
3. 基于密度分布的K-Means初始聚类中心选择算法 [J] . 李梅莲 . 许昌学院学报 . 2017,第002期
4. 基于密度最大值的K-means初始聚类中心点算法改进 [J] . 刘闯 ,陈桂芬 . 数字技术与应用 . 2017,第011期
5. 基于密度最大值的K-means初始聚类中心点算法改进 [J] . 刘闯1 ,陈桂芬1 . 数字技术与应用 . 2017,第011期
6. 基于主题模型的K-means初始聚类中心优化方法 [C] . 关鹏 ,王日芬 ,张海永 . 信息系统协会中国分会第六届学术年会 . 2015
7. 基于密度峰值优化的K-means文本聚类算法研究 [A] . 齐先婷 . 2018

基于密度优化初始聚类中心的K-means算法

摘要

著录项

相似文献

相关主题

期刊订阅