数据挖掘与OLAP的关系

2020年10月28日16:08:30数据挖掘与OLAP的关系已关闭评论

数据挖掘与OLAP的关系

在比较成熟的系统中,数据分析过程都是基于以数据仓库为基础,OLAP (On-Line Analytical Prolessing,在线分析处理)和数据挖掘相辅相成的分析模式。数据仓库将来自于各种数据源的数据,根据不同的主题进行存储,并对原始数据进行抽取、转换和加载等一系列筛选和清理工作。OLAP 则将数据通过多维视角和多种层次向用户进行多方式的呈现。数据挖掘则应用不同的算法,向用户揭示数据间的规律性,从而辅助商业决策。

报告和 OLAP 是用于理解过去所发生事务的重要工具。数据挖掘则是用于了解将来可能发生事务的方法。数据挖掘用预测性模型(包括统计和机器学习技术—如神经网络)来预测将来。

例如,查询和报告告诉你上个月的总体销售情况。OLAP 则层层深入地告诉你上个月各项产品的销售情况。然而,数据挖掘会告诉你下个月谁可能会买你的产品。而且,为了最好的商务效益,将开发和数据挖掘相结合,以发现如何使产品个性化以导致最大可能性的购买。

OLAP 和数据挖掘的主要区别在于:在辅助决策时,前者是基于用户建立的一系列假设驱动,通过 OLAP 来证实或者推翻这些假设,是一个演绎推理的过程;数据挖掘是通过归纳的方式,在海量数据中主动找寻模型,自动发掘隐藏在数据中的价值信息。

相对于 OLAP,数据挖掘把更多的主动权交给了挖掘工具,在一定程度上,可以看成人工智能的初级应用。此外,OLAP 限于结构化数据,侧重与用户的交互、快速响应,以及提供多维视图,而数据挖掘还可以分析诸如文本的、空间的和多媒体的非结构化数据。

二者相辅相成。OLAP 的分析结果可以补充到系统知识库中,给数据挖掘提供分析信息并作为数据挖掘的依据;数据挖掘所发现的知识可以指导 OLAP 的分析处理,拓展OLAP的深度,以便发现OLAP所不能发现的、更为复杂而细密的信息。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。