首页> 中文学位 >基于形式概论分析的类无冗余关联分类规则提取研究
【6h】

基于形式概论分析的类无冗余关联分类规则提取研究

代理获取

摘要

近年来,随着信息技术的不断发展,人们所面临的数据量越来越庞大,如何从这么丰富的数据中,发现其隐含的有用的价值,便成了人们所关注的焦点。于是数据挖掘技术便诞生了,数据挖掘涉及多学科技术的集成,包括数据库和数据仓库技术、统计学、机器学习、人工智能等。
  分类是数据挖掘领域中的一个重要课题,是通过训练样本数据集的学习,构造分类规则的过程。概念格是一种强有力的数据分析工具,是一种能够表达数据中各种模式的完备结构,因而是数据挖掘领域的一个热点。概念格中可以提取关联规则、分类规则、蕴含规则等模式,基于概念格的分类规则的研究主要集中在概念格构建的优化、规则求解算法的优化以及规则的优化。
  本文通过对概念格的构造进行研究,针对分类任务的性质,设计一种适合分类的概念格构造方法,基于此概念格上提取出相应的分类规则。由于基于概念格上提取的分类规则,产生了许多冗余的和冲突的分类规则,然后通过信息熵的性质—信息熵从平均意义上来描述信息源的信息,用来描述信息源提供的平均信息量,也可以描述信息源的平均不确定性,利用信息增益对这些分类规则的重要程度的进行度量。最后将信息增益与传统的冗余分类规则定义相结合,得到了一个类无冗余分类规则的定义,根据定义进行类无冗余分类规则的提取,实验证明上述的方法有效。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号