首页> 中文会议>第六届全国信息检索学术会议 >一种基于语义引力及密度分布的聚类算法

一种基于语义引力及密度分布的聚类算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

由于传统的相似性度量计算方法在数据聚类、特别是高维数据聚类过程中存在的问题，基于数据重力的相似度计算方法被引入聚类过程。针对此类方法在表达类间相似关系方面存在的不足，本文提出一种新的基于语义引力及密度分布的聚类算法。一方面，将物理学中的质量和引力等概念引入到聚类分析中，将语义引力作为数据间相似性的度量方法，不但充分考虑了数据间的几何距离可分性，而且强调了数据间属性的相关性，使其对不规则分布的样本也有较好的聚类效果；另一方面，将基于划分的聚类与基于密度的聚类方法相结合并予以改进，通过对对象密度的计算，以密度较大的对象为聚类中心进行聚类，从而降低了由于初始聚类中心选择偏差造成的影响，保证了更好的精度。实验结果表明本文提出的算法具有更准确的聚类结果，特别是在文本这样的高维、稀疏的数据中更是如此。

著录项

来源
《第六届全国信息检索学术会议》|2010年|570-577|共8页
会议地点黑龙江镜泊湖
作者
李政涛; 夏树倩; 王大玲; 冯时; 张一飞;
展开▼
作者单位

中国中文信息学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类算法理论;
关键词
聚类算法; 语义引力; 密度分布;

相似文献

中文文献
外文文献
专利

1. 一种基于语义相似度的信息资源语义聚类算法 [J] . 熊芳 ,黄宏斌 ,黄玉成 . 计算机工程与科学 . 2012,第011期
2. 一种基于引力的分层聚类算法 [J] . 贾瑞玉 ,查丰 ,耿锦威 . 计算机技术与发展 . 2011,第003期
3. 一种基于网格的引力聚类算法 [J] . 张天伍 ,荆立夏 . 微计算机信息 . 2009,第018期
4. 一种基于引力的聚类算法 [J] . 张天伍 ,詹自熬 . 河南科学 . 2009,第001期
5. 一种基于旋转超盒和引力场融合的聚类算法 [J] . 张燕 ,贾焰 ,黄晓斌 . 计算机研究与发展 . 2008,第0z1期
6. 一种基于旋转超盒和引力场融合的聚类算法 [C] . 张燕 ,贾焰 ,黄晓斌 . 2007全国理论计算机科学学术年会 . 2007
7. 基于语义引力及密度分布的Web文本聚类算法的研究与实现 [A] . 李政涛 . 2011

一种基于语义引力及密度分布的聚类算法

摘要

著录项

相似文献

相关主题

期刊订阅