文摘
英文文摘
论文说明:图表目录
声明
致谢
引 言
第一章 数据挖掘概述
1.1数据挖掘概念
1.1.1数据挖掘的定义
1.1.2数据挖掘应用的现状
1.2数据挖掘任务及挑战
1.2.1高维数据挖掘
1.2.2海量数据挖掘
1.2.3流数据挖掘
1.2.4数据挖掘面临的挑战
1.3本章小结
第二章 属性选择方法概述
2.1属性选择概述
2.1.1属性选择定义
2.1.2属性选择的分类
2.1.3属性选择的评估方法
2.1.4属性选择面临的困难
2.2经典属性选择方法概述
2.2.1 Relief方法
2.2.2主成分分析方法(PCA)
2.2.3粗糙集合方法
2.2.4信息熵方法
2.2.5遗传算法
2.2.6 One-R方法
2.2.7 Wrapper方法
2.3属性选择方法实验及分析
2.4本章小结
第三章 Information Value概述
3.1 WoE(Weight of Evidence)简介
3.1.1 WoE的定义
3.1.2 WoE计算示例
3.1.3 WoE的优点
3.2 IV(Information Value)简介
3.2.1 IV指标的定义
3.2.2 IV指标计算示例
3.2.3 IV指标的优点与不足
3.3本章小结
第四章 基于IV指标的属性选择方法及分类模型研究
4.1基于IV的属性选择指标
4.2 FS-IV属性选择方法
4.2.1算法思想
4.2.2实验结果及分析
4.2.3实验分析
4.3基于FS-IV的随机森林算法
4.3.1随机森林简介
4.3.2随机森林讨论
4.3.3算法描述
4.3.4实验结果及分析
4.4本章小结
第五章 FS-IV及IV-RF模型的应用研究
5.1 入侵检测应用
5.1.1入侵检测数据集分析
5.1.2实验及分析
5.2网络交易数据流应用
5.2.1 Yahoo Shopping数据流分析
5.2.2实验结果及分析
5.3高维数据集上的应用
5.3.1高维数据集分析
5.3.2实验结果及分析
5.4本章小结
第六章 总结与展望
6.1本文总结
6.2工作展望
参考文献
攻读硕士学位期间参加研究的课题和发表的论文