首页> 中文会议>第33届中国数据库学术会议(NDBC2016 ) >大数据分类挖掘算法及其概念漂移应用研究

大数据分类挖掘算法及其概念漂移应用研究

摘要

随着大数据应用研究的不断深入和分布式机器学习中流计算框架的涌现,针对数据流中概念漂移问题的研究是面向大数据挖掘领域的研究热点之一.现有的针对概念漂移的研究成果主要还是依赖于数据结构和算法优化上,主要还是通过计算资源有限的独立计算机完成概念漂移的检测.为此,本文提出一种面向大数据的基于Storm的抵抗概念漂移的分类挖掘算法及系统.该系统采用并行化窗口和S-CVFDT算法,利用并行化窗口机制检测数据流中的突变型概念漂移从而自适应的改变并行窗口大小,并通过S-CVFDT算法不断更新渐进性概念漂移时的模型.分析与实验结果表明:该算法可以快速有效地检测到突变型概念漂移降低系统因为突变型概念漂移造成的资源浪费,且模型建立效率、分类精度得到提高.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号