首页> 中文学位 >基于连续属性离散化的属性偏序理论的知识发现
【6h】

基于连续属性离散化的属性偏序理论的知识发现

代理获取

目录

声明

第1章 绪 论

1.1引言

1.2课题背景及意义

1.3国内外研究现状

1.4本论文主要研究内容

第2章 离散化问题描述

2.1引言

2.2认知事物的基本哲学原理

2.3模式可分原理

2.4形式背景基础属性与对象特征的定义

2.5形式背景预处理及优化

2.6离散化问题描述、过程及目标

2.7本章小结

第3章 基于改进的局部线性嵌入的高维数据离散化方法

3.1引言

3.2局部线性嵌入算法

3.3改进的局部线性嵌入算法

3.4典型的数据离散化算法

3.5基于改进的CAIM的离散化方法

3.6算法及性能评估

3.7本章小结

第4章 滚动轴承振动信号的故障诊断的知识发现

4.1引言

4.2轴承故障数据

4.3轴承振动信号的知识发现

4.4本章小结

结论

参考文献

致谢

展开▼

摘要

计算机技术的迅猛发展和数据库系统的普遍使用,给人们提供了强有力的平台,去更好地利用信息技术进行生产,而且搜集和检索数据的能力也有显著提高。丰富多样的信息感知和采集设备引领我们步入大数据时代。然而,采用什么样的手段和技术从海量数据中发现对决策非常有价值的规则和知识,成为前沿科技亟需解决的关键问题。数据挖掘与机器学习作为处理数据的重要手段,已然成为当今研究的一个热点问题。但是,许多知识发现和数据挖掘的算法得以进行的先决条件就是所要处理的属性值是离散值,而在现实生活中得到的数据常常是连续属性,所以必须对连续属性进行离散化处理。
  本文通过以UCI数据集的知识发现和规则提取为基础,通过主流连续属性离散化方法的对数据集中的多维属性值进行离散化处理,并且以形式概念分析理论的形式背景的可视化表达为重要手段,运用离散化处理后的数据结果构建二值形式背景,以形式背景分层优化和属性偏序结构图生成方法为关键环节,生成不同数据集的属性偏序结构图,进行知识的规则提取,通过与数据集的分布特点及类标签来比较,对离散化方案进行评估。主要内容如下:
  1)建立了基于形式背景的知识表达原理的混合数据集成框架,实现各种数据在一个框架下可视化表示和基于属性偏序结构理论实现的数据挖掘。
  2)研究了基于优化形式背景生成偏序结构原理的知识发现数学方法,生成了基于属性覆盖对象(或者对象覆盖属性)原理的数据偏序结构图。
  3)针对现有离散化算法在高维数据处理中的局限性,研究了一种基于非线性降维技术的高维数据离散化方法-改进局部线性嵌入算法,实现基于连续属性离散化的属性偏序理论的知识发现。
  本文通过对UCI数据集的降维及离散化处理后,有着更高精度的知识,简化了复杂的知识规则,对大数据的知识规则提取及可视化有重要意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号