数据挖掘和联机分析处理(OLAP)的区别 一个经常遇到的问题是,数据挖掘和OLAP到底有何不同。 下面将会进行解释,它们是完全不同的工具,基于的技术也大相径庭。 OLAP是决策支持领域的一部分。传统的...
数据挖掘和数据仓库的关系
数据挖掘和数据仓库的关系 在大多数情况下,数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中。从数据仓库中提取进行数据挖掘的数据有许多好处。 数据仓库的数据清理和数据挖掘的数据清理差不多,如果...
数据挖掘逐渐演变的过程
数据挖掘逐渐演变的过程 数据挖掘其实是一个逐渐演变的过程。 在电子数据处理的初期,人们就试图通过某些方法来实现自动决策支持,当时机器学习成为人们关注的焦点。机器学习的过程就是将一些已知的并已被成功解决...
数据挖掘技术的由来与背景
数据挖掘技术的由来 现在,人们生活在一个信息爆炸的时代。 据估计,《纽约时报》一周报道的信息总量比18世纪一个人一生接触的信息总量还多。IDC发布的一份调研报告称,2010年创建数字信息总量将达到98...
数据挖掘
啤酒与尿布案例的关联分析
啤酒与尿布案例的关联分析 一个超市的销售系统记录了客户购物的情况。表7-7中记录了5位客户的购物清单。 表7-7 某超市5位客户的购物清单 超市经理想知道商品之间的关联,要求列出那些同时购买的、且支持...
Apriori算法的基本思想
Apriori算法的基本思想 频繁项集的所有非空子集也都必须是频繁的,这是Apriori的性质。基于这个性质,如果项集 I 不满足最小支持度阈值 minsup ,则 I 不是频繁的,即P( A )&l...
决策树的优点缺点
决策树的优点缺点 相对于其他模型而言,决策树有如下优点: (1)决策树所产生的预测规则的形式为:如果 x r 1 ∈ A 1 …且 x r m ∈ A m ,那么 Y =y,很容易解释。 (2)在树的...
统计分析与数据挖掘的主要区别
统计分析与数据挖掘有什么区别呢? 从实践应用和商业实战的角度来看,这个问题并没有很大的意义,正如“不管白猫还是黑猫,抓住老鼠才是好猫”一样,在企业的商业实战中,数据分析师分析问题、解决问题时,首先考虑...
Tableau的功能与特点
Tableau的功能与特点 Tableau是桌面系统中最简单的商业智能工具软件之一,它不强迫用户编写自定义代码,新的控制台可完全自定义配置。Tableau控制台灵活,具有高度的动态性,不仅能够监测信息...
QlikView的功能与特点
QlikView的功能与特点 QlikView是一个完整的商业分析软件,使开发者和分析者能够构建和部署强大的分析应用。QlikView应用使各种终端用户以一个高度可视化、功能强大和创造性的方式,互动分...
Power BI的功能与特点
Power BI的功能与特点 Power BI是一套业务分析工具,用于在组织中提供见解。它可连接数百个数据源,简化数据准备工作并提供专门分析。它可生成美观的报表并进行发布,供用户在Web和移动设备上使...
Intelligent Miner的功能与特点
Intelligent Miner的功能与特点 由美国IBM公司开发的数据挖掘软件Intelligent Miner是一个分别面向数据库和文本信息进行数据挖掘的软件系列,它包括Intelligent ...
数据挖掘和统计学的关系
数据挖掘和统计学的关系 数据挖掘并不是对统计学的代替。实际上,统计学是对数据挖掘的很好的补充。经典的统计学技术,如回归与数据挖掘技术、神经网络一起应用。统计学也可用于验证数据挖掘结论。 显然,统计学和...
数据挖掘与OLAP的关系
数据挖掘与OLAP的关系 在比较成熟的系统中,数据分析过程都是基于以数据仓库为基础,OLAP (On-Line Analytical Prolessing,在线分析处理)和数据挖掘相辅相成的分析模式。...
数据挖掘
使用序列模型进行数据挖掘的例子
使用序列模型进行数据挖掘的例子 下面介绍一个使用序列模型进行数据挖掘的例子。 图15-1所示的是超市购物信息数据集,第一列是交易时间,第二列是顾客编号,第三列是购买商品信息,例如,在1993年6月10...
数据挖掘
支持度与置信度:什么意思、例子案例
支持度与置信度:什么意思、例子案例 支持度 支持度表示X和Y同时在总数据集中出现的概率。 图14-1所示的是顾客序号和顾客购买的商品。其中,顾客1000同时购买了商品A、B和C,顾客2000同时购买了...
K-Medoids算法:什么意思、具体方法、优点缺点
K-Medoids算法:什么意思、具体方法、优点缺点 K-Medoids算法看起来和K-Means算法比较相似,但是二者是有区别的,即中心点的选取。在K-Means算法中,我们将中心点取为当前clus...
数据挖掘
K-Means算法:什么意思、例子案例、优点缺点
K-Means算法:什么意思、例子案例、优点缺点 K-Means 算法是分割式聚类算法中最常用的一种,是一种基于样本均值的计算方法,在聚类的过程中通过计算类中各对象的属性均值,作为类的中心点(重心)。...
数据挖掘
分层聚类算法:什么意思、例子案例
分层聚类算法:什么意思、例子案例 分层聚类算法是对给定的待聚类数据集合进行层次化分解。举一个例子,如图13-9所示的是事件x 1 ~x 5 的距离矩阵。 图13-9 其中,x 2 和x 3 的距离为1...
数据挖掘
什么是互斥聚类与非互斥(重叠)聚类算法
什么是互斥聚类与非互斥(重叠)聚类算法 互斥聚类(Exclusive clustering)是指每个对象被指派到单独的单个簇,即数据以独占方式进行分组。因此,如果某个数据属于确定的单个簇,则不能将其包...