简要解释数据集市(DM)和数据仓库(DW)的用途

2023年5月24日09:08:26简要解释数据集市(DM)和数据仓库(DW)的用途已关闭评论

1)DM

请简要解释DM的用途

答案:

DM(Data Mart)也称数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据,可以认为是一个局部的数据仓库。DM主要面向应用。

在数据仓库的建设过程中往往可以从DM着手,逐个建设服务不同主题和部门的数据集市,以后再用几个数据集市组成一个完整的数据仓库。

需要注意的是,数据集市是以某个业务应用为出发点而建设的,因而DM只关心自己需要的数据,不会全盘考虑企业整体的数据架构和应用。这有可能导致同一含义的字段在不同的DM中具有不同的表示方法,可能会给以后实施数据仓库时造成一些麻烦。

DM仅仅是针对一个业务领域而建立,所以针对性较强,而且容易构建清洗的结构,也容易维护修改。单独的一个DM通常数据量不会很大,但是如果给企业所有领域都建立DM,可能导致冗余加大,数据量激增。

2)DW

请简要解释DW的用途

答案:

DW就是通常所说的数据仓库(企业级数据仓库称为EDW)。比尔·门恩(Bill Inmon)给出了数据仓库这样一个定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。

所谓面向主题是指数据仓库中的数据都能很明确地服务于某个或者某几个主题,和这些主题无关的数据将被排除掉。

所谓集成是指通过ETL手段将不同系统的数据源汇总至统一系统之中。

所谓随时间变化是指数据仓库中的数据并不是一成不变的,因为业务随着时间在变化,相应的数据也会随着时间变化。

所谓不可修改是在数据仓库中的数据一旦装载后,一般只对外提供查询操作,而不提供增删改操作。

基于数据仓库可以进行不同粒度、多维的数据分析,而且数据仓库可以从多方面保证这种分析的效率:数据处理效率高、数据质量高、查询速度高。

建立数据仓库的目的通常是为了在面临多样的业务时,提升企业的决策效率,它可以为企业提供一定的BI(商业智能)能力,指导业务流程改进并监视时间、成本、质量以及控制。具体来说数据仓库有如下用途。

①整合公司所有业务数据,建立统一的数据中心。

②产生业务报表,用于进行决策。

③为网站运营提供运营上的数据支持。

④可以作为各个业务的数据源,形成业务数据互相反馈的良性循环。

⑤分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果。

⑥开发数据产品,直接或间接地为公司盈利。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。