文摘
英文文摘
致谢
第一章数据库知识发现(KDD)
第一节数据库知识发现引论
1.1.1数据库知识发现技术的由来
1.1.2数据库知识发现演变过程
第二节数据挖掘的研究历史、现状和发展前景
1.2.1研究历史
1.2.2KDD在研究和应用方面的发展现状
1.2.3数据库知识发现的发展前景
第三节数据库知识发现的定义
第四节KDD处理过程模型
1.4.1多处理阶段过程模型(1)
1.4.2多处理阶段过程模型(2)
1.4.3多处理阶段过程模型(3)
第五节KDD的特点
第六节数据挖掘(DataMining)
1.6.1数据挖掘的定义
1.6.2数据挖掘的分类
1.6.3数据挖掘的任务
1.6.4数据挖掘常用方法和技术
第七节本文主要进行的研究工作
第二章基本原理
第一节遗传算法基本知识
2.1.1基本概念
2.1.2遗传算法的本质特征
2.1.3遗传算法的数学基础
2.1.4遗传算法分析
第二节基于信息论的学习方法
2.2.1信息论原理
2.2.2信息与概率
2.2.3信息与信息熵
第三节决策树
2.3.1决策树基本知识
2.3.2基于互信息的ID3决策树构造算法
第四节贝叶斯分类器
2.4.1贝叶斯定理
2.4.2自然贝叶斯分类
第三章数据处理技术
第一节数据处理的相关方法
3.1.1数据处理任务
3.1.2数据清理
3.1.3数据综合
3.1.4数据转换
3.1.5数据的聚合和总结
3.1.6数据缩减
第二节数据仓库及联机分析处理
3.2.1数据仓库概述
3.2.2数据仓库的基本组成
3.2.3联机分析处理(OLAP)
第四章KDDGA系统及其挖掘算法实现
第一节基于遗传算法的数据库知识发现系统模型
4.1.1数据挖掘模型CRISP-DM
4.1.2基于遗传算法的数据库知识发现模型基本构造
第二节基于遗传算法的分类决策树算法
4.2.1问题提出
4.2.2数据结构
4.2.3算法流程
第三节基于遗传算法的网页识别算法
4.3.1问题的提出
4.3.2分类器的选择与编码
4.3.3遗传操作
4.3.4决策树的构造
4.3.5对于多分类问题的解决方法
第四节基于遗传算法的多层次关联规则发现算法
4.4.1问题的提出
4.4.2遗传编码
4.4.3遗传算子
4.4.4算法进一步优化
第五节预防早熟收敛的策略
第五章算法测试与结论
第一节实验工具的选择
第二节基于遗传算法的分类决策树挖掘算法实验结果
5.2.1天气示例数据库实验结果
5.2.2Cleve数据库实验结果
5.2.3调整遗传算法适应值函数参数对决策树结果的影响
5.2.4基于遗传算法的分类决策树算法实验总结
第三节基于遗传算法的网页识别算法实验结果
5.3.1不包含Hotlink单词的网页识别结果
5.3.2包含Hotlink单词的网页识别结果
5.3.3将特征数增加到60个的网页识别结果
5.3.4基于遗传算法的网页识别算法实验结果分析
第四节基于遗传算法的多层次关联规则发现算法实验结果
5.4.1实验结果
5.4.2基于遗传算法的多层次关联规则发现算法实验结果分析
结束语
参考文献