首页> 中文期刊> 《山东大学学报:工学版》 >一种基于聚类的过抽样算法

一种基于聚类的过抽样算法

         

摘要

在过抽样技术研究中,为了合成较有意义的新样本,提出一种基于聚类的过抽样算法Clustered SMOTE-Boost。过滤小类的噪声样本,将剩余的每个小类样本作为目标样本参与合成新样本。对整个训练集聚类,根据聚类后目标样本所在簇的特点确定其权重及合成个数。将所有目标样本聚类,在目标样本所在的簇内选取K个近邻,并从中任选一个与目标样本合成新样本,使新样本与目标样本簇内的样本尽量相似,并减少由于添加样本而造成的边界复杂度。试验结果表明,Clustered SM OTE-Boost算法在各个度量上均明显优于SM OTE-Boost、ADASYN-Boost和Borderline SM OTE-Boost三种经典算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号