基于样本权重更新的不平衡数据集成学习方法

陈圣灵; 沈思淇; 李东升

首页> 中文期刊> 《计算机科学》 >基于样本权重更新的不平衡数据集成学习方法

基于样本权重更新的不平衡数据集成学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

不平衡数据的问题普遍存在于大数据、机器学习的各个应用领域,如医疗诊断、异常检测等.研究者提出或采用了多种方法来进行不平衡数据的学习,比如数据采样(如SMOTE)或者集成学习(如EasyEnsemble)的方法.数据采样中的过采样方法可能存在过拟合或边界样本分类准确率较低等问题,而欠采样方法则可能导致欠拟合.文中将SMOTE,Bagging,Boosting等算法的基本思想进行融合,提出了Rotation SMOTE算法.该算法通过在Boosting过程中根据基分类器的预测结果对少数类样本进行SMOTE来间接地增大少数类样本的权重,并借鉴Focal Loss的基本思想提出了根据基分类器预测结果直接优化AdaBoost权重更新策略的FocalBoost算法.对不同应用领域共11个不平衡数据集的多个评价指标进行实验测试,结果表明,相比于其他不平衡数据算法(包括SMOTEBoost算法和EasyEnsemble算法),Rotation SMOTE算法在所有数据集上具有最高的召回率,并且在大多数数据集上具有最佳或者次佳的G-mean以及F1Score;而相比于原始的AdaBoost,FocalBoost则在其中9个不平衡数据集上都获得了更优的性能指标.

著录项

来源
《计算机科学》 |2018年第7期|31-37|共7页
作者
陈圣灵; 沈思淇; 李东升;
展开▼
作者单位

国防科技大学并行与分布处理国家重点实验室长沙410073;

国防科技大学并行与分布处理国家重点实验室长沙410073;

国防科技大学并行与分布处理国家重点实验室长沙410073;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
SMOTE; Boosting; 不平衡数据; 集成学习;

相似文献

中文文献
外文文献
专利

1. 基于样本权重的不平衡数据欠抽样方法 [J] . 熊冰妍 ,王国胤 ,邓维斌 . 计算机研究与发展 . 2016,第011期
2. 基于不平衡权重和分布更新规则的粒子群算法 [J] . 李克文 ,陈振文 . 计算机与数字工程 . 2020,第011期
3. 基于Adaboost的选择性样本权重更新算法 [J] . 赵春晖 ,张洪才 ,陆朝霞 . 计算机应用研究 . 2008,第010期
4. 一种新的Adaboost样本权重更新算法 [J] . 潘奇明 ,朱谊强 . 重庆理工大学学报（自然科学版） . 2008,第006期
5. 基于特征选择的高维数据集成学习方法研究 [J] . 周钢 ,郭福亮 . 计算机科学 . 2021,第0z1期
6. 一种基于HDDT集成的多类不平衡学习方法 [C] . 钱祺 ,姜远 . 2011年江苏省人工智能学术会议 . 2011
7. 基于过采样的不平衡数据集成分类算法研究 [A] . 赵学华 . 2020

基于样本权重更新的不平衡数据集成学习方法

摘要

著录项

相似文献

相关主题

期刊订阅