首页> 中文学位 >分类模型的不匹配问题及其解决方法
【6h】

分类模型的不匹配问题及其解决方法

代理获取

目录

分类模型的上匹配问题及其解决方法

MODEL MISFIT IN CLASSIFICATION AND ITS SOLUTION

摘 要

Abstract

目 录

第1章 绪 论

1.1 课题背景及研究的目的和意义

1.2 自动分类技术的发展概况

1.2.1 有监督分类技术的研究现状

1.2.2 半监督分类技术的研究现状

1.3 研究问题的定义

1.4 本文的结构安排

第2章 自动分类的理论和技术

2.1 分类的定义

2.2 有监督分类的相关技术

2.3 半监督分类的相关技术

第3章 基于路径的决策簇分类器

3.1 决策簇分类器介绍

3.2 决策簇分类器的问题

3.3 基于路径的决策簇分类器

3.4 实验与分析

3.4.1 实验描述

3.4.2 实验结果

3.5 本章小结

第4章 解决决策树模型上匹配的随机森林

4.1 随机森林介绍

4.2 随机森林的相关概念

4.3 基于专属随机树的随机森林

4.4 实验与分析

4.4.1 实验描述

4.4.2 实验结果

4.5 本章小结

第5章 基于层次聚类树的聚类标记

5.1 半监督学习

5.2 聚类标记

5.3 基于层次聚类树的聚类标记法

5.3.1 基本定义

5.3.2 PRC-Tree 分类器

5.3.3 为什么我们的算法能解决上匹配问题

5.4 实验与分析

5.4.1 实验描述

5.4.2 实验结果

5.5 本章小结

结 论

参考文献

攻读硕士学位期间发表的论文及其它成果

哈尔滨工业大学硕士学位论文原创性声明

致 谢

展开▼

摘要

随着计算机软硬件技术的不断发展,大量的数据得以收集。与此同时,原有的数据处理及分析技术面临着越来越多的挑战。分类是机器学习和数据挖掘的一项基本任务,如何构建泛化能力更强的分类器一直是计算机领域的热点问题。
  大多数分类技术都是基于一定的假设建立模型的。当数据匹配模型时,分类效果会很好;而当不匹配时,分类的效果往往会很差。如何解决分类模型的不匹配问题是本文的核心议题。概括来讲,本文的主要工作包括以下几个方面:
  1)介绍了一种新的解决复杂、高维数据的基于聚类的分类方法(Decision Cluster Classifier,DCC),通过分析指出其在特征异构时会导致模型不匹配的问题,并提出了一种新的基于路径的分类策略PDCC以解决DCC的模型不匹配问题。
  2)提出了一种新的决策树构建方法以用来集成随机森林。一般来讲,决策树容易产生过拟合现象,这也是一种比较特殊的模型不匹配问题。目前,用来解决这一问题的主要方法是通过集成多棵随机决策树的方式来构建集成分类器。但现有方法存在效率低下,差异性难以控制等问题。本文提出了一种新的基于专属随机决策树的随机森林算法,以有效解决多类数据中决策树的模型不匹配问题。
  3)提出了一种新的半监督分类算法以解决聚类标记(Cluster-and-Label)的模型不匹配问题。半监督分类一般基于一定的假设运行,其中聚类假设是一个最常用的假设。聚类标记法可以简单看作直接基于聚类假设运行的一类半监督学习技术,但它的性能受到聚类质量的严重制约。本文则提出一种层次聚类树的技术以解决这一问题。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号