首页> 中文学位 >基于支持向量机的高维不平衡数据二分类方法的研究
【6h】

基于支持向量机的高维不平衡数据二分类方法的研究

代理获取

目录

第1章 绪 论

1.1 研究背景与研究目的

1.2 国内外研究现状

1.3 主要研究内容

1.4 章节结构安排

第2章 高维不平衡数据二分类方法基础研究

2.1 高维不平衡数据的本质

2.2 高维不平衡数据分类困难概述

2.3 支持向量机解决高维不平衡问题的优势

2.4 评价标准

2.5 本章小结

第3章 改进BRFE-PBKS-SVM算法

3.1考虑不平衡问题的特征选择算法

3.2 希尔伯特空间下的过采样算法

3.3 BRFE-PBKS-SVM算法描述

3.4本章小结

第4章 实验结果与分析

4.1实验数据与参数设置

4.2 高维不平衡数据中新型问题的存在性验证及结果分析

4.3 BRFE-PBKS-SVM算法的有效性验证

4.4本章小结

结论

参考文献

攻读学位期间发表的学术论文

声明

致谢

展开▼

摘要

近年来,生物信息学、模式识别等不少领域中,出现了同时存在高维问题和不平衡问题的高维不平衡数据。高维问题是指由于数据集特征空间维数过高而存在着一些对分类效果产生负面影响的特征组合,导致分类效果不佳;不平衡问题是指在数据集里不同类别的样本在数量上分布不均匀,导致分类器对少数类关注不够,容易忽略它们蕴含的珍贵信息,从而影响分类效果。在高维不平衡数据中,高维问题和不平衡问题同时存在,互相影响,形成了新的问题。到目前为止,不少研究者单独针对高维问题和不平衡问题进行了研究,并提出了一系列成熟的算法。但是对同时展现出高维特性和不平衡特性的数据,绝大部分现有的方法都是先解决高维问题或不平衡问题,再解决另一个问题,并没有考虑到高维特性和不平衡特性相互影响而形成的新问题。
  本文首先对高维问题和不平衡问题分别进行了介绍,并分析了高维问题和不平衡问题相互影响形成的新问题,通过阐述这些问题逐步展开分析研究。然后介绍了支持向量机 SVM,分析它在解决高维问题和不平衡问题中的优势,并对现有的一些解决高维问题和不平衡问题的算法进行总结,分析其优缺点。接着,改进 SVM-RFE算法以便在考虑不平衡特性的情况下对高维数据进行特征选择,并基于SVM自动划分边界样本的特点改进 SMOTE过采样算法以便在希尔伯特空间下进行边界过采样,同时对边界少数类样本的过采样倍率进行调节,提出了一种针对高维不平衡数据二分类的BRFE-PBKS-SVM算法。随后进行了一系列的实验,并且采用可以有效考察算法效果的多种指标来评价实验结果,证明了该算法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号