首页> 中文学位 >基于集成的单标签和多标签数据流分类算法研究
【6h】

基于集成的单标签和多标签数据流分类算法研究

代理获取

目录

声明

致谢

摘要

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究现状

1.2.1 单标签数据流分类国内外研究现状

1.2.2 多标签分类国内外研究现状

1.2.3 多标签数据流分类国内外研究现状

1.3 当前研究中存在的问题

1.4 研究内容与组织结构

1.4.1 研究内容

1.4.2 论文组织结构

2 分类算法简介

2.1 数据流分类算法简介

2.1.1 增量学习

2.1.2 集成学习

2.1.3 现实工具

2.2 多标签分类算法简介

2.2.1 问题转换

2.2.2 算法适应

2.2.3 评价指标

2.2.4 现实工具

2.3 多标签数据流分类算法简介

2.3.1 评价指标

2.3.2 现实工具

2.4 本章小结

3 基于快速无监督特征选择的数据流分类算法

3.1 问题定义

3.2 算法基础

3.2.1 无监督特征选择

3.2.2 DXMiner算法

3.3 基于快速无监督特征选择的数据流分类算法

3.3.1 算法基本思想

3.3.2 两种特征子集快速选择方法

3.3.3 统一特征空间

3.3.4 分类器训练与更新

3.4 实验及结果分析

3.4.1 特征选择算法性能比较

3.4.2 特征子集的大小对分类效果的影响

3.4.3 分类算法性能对比

3.5 本章小结

4 加权的集成多标签数据流分类算法

4.1 算法基础

4.1.1 ML-KNN算法

4.2 基于集成的加权多标签数据流分类算法

4.2.1 算法基本思想

4.2.2 算法的训练与更新

4.2.3 权重调节

4.3 实验及结果分析

4.3.1 SWMEC与其基准算法ML-KNN算法的性能比较

4.3.2 SWMEC与SMART算法的性能比较

4.4 本章小结

5 集成大小不限的多标签数据流分类算法

5.1 集成大小不限的加权多标签数据流分类算法

5.1.1 算法基本思想

5.1.2 算法的训练与更新

5.1.3 权重调节

5.2 实验及结果分析

5.2.1 SWMUEC与MLKNN、SMART的性能比较

5.2.2 SWMUEC与改进前算法SWMEC的性能比较

5.3 本章小结

6 结论与展望

6.1 研究总结

6.2 工作展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

与传统的静态数据相比,现代数据多以数据流的形式产生和积累,数据类型方面也越来越常见到多标签类型。数据形式与类型的变化无论对单标签数据流分类还是多标签数据流分类都提出了巨大的挑战。本文针对单标签数据流分类算法,在前人工作的基础上提出了两种改进算法;另一方面,针对多标签数据流分类算法,本文受以往研究成果的启发,提出了两种新颖的分类算法。具体工作如下:
  (1)为解决单标签数据流分类算法大多无法解决特征演化且分类效果欠佳的问题,本文改进静态数据环境下的无监督特征选择算法,降低其时间复杂度来适应数据流环境,并以DXMiner算法为原型,应用改进后的无监督特征选择算法优化其特征选择部分,提出了一种基于集成学习与无监督特征选择思想的数据流分类算法。
  (2)由于工作(1)中所提算法的时间复杂度仍有优化空间,本文采用一种在高维度数据环境下表现优异的数据结构进一步改进算法的特征选择部分,提出了一种改进的基于集成学习与快速无监督特征选择的数据流分类算法。
  (3)为解决多标签数据流分类综合了多标签数据分类与数据流分类两方面的难点,本文受多标签静态数据分类算法的启发,提出了一种动态加权集成的多标签数据流分类算法。该算法使用ML-KNN模型与KNN思想训练基分类器,并设计一种新颖的动态变化的权重调节机制,动态集成各个子分类器来最终给出分类结果,分类后数据被用来训练新的子分类器并替换原模型中表现不好的分类器。
  (4)工作(3)中所提算法中集成模型的大小对分类效果影响极大,而该参数需要人工确定,另外该算法在更新过程中舍弃了部分有用的信息。为解决模型大小确定困难与丢失信息不利于分类的问题,本文提出了一种集成大小不固定的多标签数据流分类模型。新模型维护一个分类器池,每次分类时从池中动态的选取若干子分类器加权集成,处理过的数据又被训练成新的模型并加入分类器池中。
  本文的主要贡献在于:第一,工作(1)、(2)均解决了单标签数据流分类算法大多未考虑的特征演化问题并且时间复杂度足够低来适用于数据流环境;第二,在目前多标签数据流分类研究工作还较少的情况下,工作(3)、(4)为其他研究人员提出了两种可用的解决思路,丰富了这方面的研究;第三,在真实数据集上,分别对上述四种算法进行了实验,结果表明各算法在分类效果与时间消耗上均有良好表现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号