数据集市与数据仓库的关系

2020年11月9日16:56:40数据集市与数据仓库的关系已关闭评论

数据集市与数据仓库的关系

在一个企业中,数据仓库存储了从各个操作型数据库、外部数据库以及其他数据库中提取出来的数据,它是一个已经被净化、转换和编码化了的中心数据源,所以,可以被管理者和其他业务人员用于数据挖掘、在线分析、市场研究以及决策支持等。数据仓库可被细分为若干个数据集市(Data Marts),其中包含侧重于公司特定业务方面的数据子集。如一个公司的某个部门或者某个业务流程。

如图2.2所示,数据集市可以分成两种:一种是从属数据集市;另一种是独立数据集市。

数据集市与数据仓库的关系

图2.2 数据仓库、从属数据集市和独立数据集市示意图

图2.2中(a)表示的是数据仓库的逻辑结构。其中的数据来自各个不同的数据源,这种中央数据仓库的做法可以保证数据的一致性,也方便数据的维护。

图2.2中(b)表示的是从属数据集市的逻辑结构。所谓从属,是指它的数据直接来自中央数据仓库。显然,这种结构仍能保持数据的一致性。一般为那些访问数据仓库十分频繁的关键业务部门建立从属的数据集市,这样可以很好地提高查询的反应速度。

图2.2中(c)表示的是独立数据集市的逻辑结构,它的数据直接来源于各生产系统。许多企业在计划实施数据仓库时,往往出于投资方面的考虑,最后建成的就是这种结构的独立数据集市,用来解决个别部门比较迫切的决策问题。

从这个意义上讲,它和企业数据仓库除了在数据量的大小和服务对象上有所区别外,逻辑结构并无多大区别,也许这是把数据集市称为部门数据仓库的主要原因。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。