首页> 外文学位 >Une approche objective pour determiner le nombre de clusters dans le cadre de la classification floue non supervisee.
【24h】

Une approche objective pour determiner le nombre de clusters dans le cadre de la classification floue non supervisee.

机译:在无监督模糊分类的情况下确定聚类数目的客观方法。

获取原文
获取原文并翻译 | 示例

摘要

La majorite des algorithmes de clustering souffrent du probleme de determination du nombre de clusters qui est souvent laisse a l'utilisateur. A ce probleme, plusieurs fonctions appelees indices de validite ont ete proposees. Le premier constat ayant attire notre attention est la difficulte rencontree par la plupart des indices de validite en presence des donnees avec une grande variation dans la structure geometrique des clusters, plus particulierement pour ce qui est de la forme, la densite et l'orientation. Une autre source d'echec de ces indices est le chevauchement entre les clusters. Deuxiemement, nous avons constate que la plupart des chercheurs utilisent des donnees communes du domaine public pour valider leurs indices et comparer leurs performances. Peu de recherches evaluent la performance des indices de validite sur des hypotheses formelle de melange gaussien.; Afin de resoudre ces problemes, nous proposons un nouvel indice de validite et une nouvelle methode pour une evaluation objective des indices de validite. Notre nouvel indice tient compte de la variation des structures geometriques des clusters, alors que notre nouvelle methode d'evaluation consiste a generer des donnees de test valides avec differents degres de difficultes. Nous avons effectue des experimentations sur une grande variete de donnees de test. Notre nouvel indice de validite a demontre une grande fiabilite quand les clusters deviennent de moins en moins separables.
机译:大多数聚类算法遭受确定通常留给用户的聚类数目的问题。对于这个问题,已经提出了几种称为有效性指数的功能。引起我们注意的第一个观察结果是,在存在簇的几何结构(尤其是形状,密度和方向)变化很大的数据的情况下,大多数有效性指标都遇到了困难。这些索引的另一个失败原因是集群之间的重叠。其次,我们发现大多数研究人员使用公共领域的公共数据来验证其索引并比较其性能。很少有研究评估有效性指数对高斯混合形式假设的性能。为了解决这些问题,我们提出了一种新的有效性指标和一种新的客观评价有效性指标的方法。我们的新指标考虑了群集几何结构的变化,而我们的新评估方法包括生成具有不同难度的有效测试数据。我们已经对各种各样的测试数据进行了实验。当簇变得越来越不可分离时,我们的新有效性指标已显示出很高的可靠性。

著录项

  • 作者

    Bouguessa, Mohamed.;

  • 作者单位

    Universite de Sherbrooke (Canada).;

  • 授予单位 Universite de Sherbrooke (Canada).;
  • 学科 Computer Science.
  • 学位 M.Sc.
  • 年度 2005
  • 页码 93 p.
  • 总页数 93
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 自动化技术、计算机技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号