1.数据集市的定义
作为具有特定应用的数据仓库,数据集市(Data Mart, DM)从数据源中收集数据,是企业数据仓库的一个子集。数据集市作为部门级的数据仓库,一般只能为某个局部范围内的管理人员服务,它主要针对某个具有战略意义的应用或者具体部门的应用,支持用户利用已有的数据获得重要的竞争优势或者找到进入新市场的具体解决方案。如:人力资源数据集市、财务数据集市、运输数据集市和仓储数据集市等。
2.数据集市的特点
数据集市除具有数据仓库的基本特征以外,还具有以下特点。
1)规模较小,且灵活。可以按照多种方式来组织数据,如按特定的应用、部门、地域、主题等。
2)一般由业务部门主持开发工作,负责定义、设计、实施、管理和维护。
3)能够快速实现,代价较低,投资回收期短,风险小。
4)工具集的紧密集成,便于数据的快速访问和分析。
5)有利于进一步升级到完整的数据仓库或形成分布式数据仓库。
3.数据集市的类型
数据集市可以分为两种:一是从属的数据集市(Dependent Data Mart),数据来源于中央数据仓库,如图3-7a所示。二是独立的数据集市(Independent Data Mart),数据直接来源于数据源,如图3-7b所示。
图3-7 两种类型的数据集市 a)从属的数据集市 b)独立的数据集市