首页> 中文期刊> 《计算机应用研究》 >带有超长方体约束的少数类样本生成机制

带有超长方体约束的少数类样本生成机制

         

摘要

合成少数类过采样技术(SMOTE)是解决类不平衡问题的有效方法之一。但是,SMOTE的线性插值机制将合成样本限制在原始样本的连线上,导致新样本缺乏多样性,并且这条连线穿过多数类区域时可能会生成噪声样本。针对上述问题,提出一种带有超长方体约束的少数类样本生成机制。该机制使用超长方体作为新样本的生成区域来代替线性插值,以增加合成样本与原始样本的差异性。并通过检测超长方体内是否存在多数类样本来决定是否修正此超长方体,从而防止新合成样本落入多数类区域内。使用所提机制替换线性插值,并集成在SMOTE、Borderline-SMOTE和ADASYN三种过采样方法中,然后在KEEL的11个标准数据集上进行了实验评估。结果表明,相比于原始方法,集成后的方法能够帮助分类器取得更高的F_(1)值和相当的G-mean。这说明超长方体生成机制能够显著改善分类器对少数类样本的识别能力,并且能够兼顾到多数类样本。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号