首页> 中文期刊> 《中国市场》 >统计与数据挖掘的关系探讨

统计与数据挖掘的关系探讨

         

摘要

统计是一门收集数据、分析数据,并根据数据进行推断的艺术和科学,它分为描述统计和推断统计。描述统计包括对客观现象的度量、调查方案的设计,是对所收集的数据资料进行加工整理、综合概括,通过图示、列表等对资料进行分析和描述。推断统计是在搜集、整理检测样本数据的基础上,对有关总体做出推断,其特点是根据随机性的观测样本数据以及问题的条件和假定,对未知事务做出以概率形式表述的推断。而数据挖掘是基于已有数据的一种模式建立和模式识别。是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有事先未知、有效和实用三个特征。先前未知的信息是指该信息是预先未曾预料到的,数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。在商业应用中最典型的例子就是沃尔玛连锁店通过数据挖掘发现了小孩尿布和啤酒之间有着惊人的联系。那么,二者之间的关系如何?文中将从区别和联系两方面进行探讨。统计与数据挖掘的区别虽然数据挖掘和统计都关心从数据中发现某中结构,但数据挖掘还应用了其他学科的思想、工具和方法,尤其是计算机领域的知识,如数据库技术、人工智能等,而这些与传统统计的研究并没...

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号