什么是数据仓库:数据仓库的特点

2020年9月21日20:07:50什么是数据仓库:数据仓库的特点已关闭评论

什么是数据仓库:数据仓库的特点

目前比较通用的对数据仓库的定义是William H. Inmon在1996年提出的,他对数据仓库的定义得到了大多数学者和工程人员的接受:数据仓库是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用以支持经营管理中的决策制定过程。由此定义可以看出,数据仓库具有以下特性。

1.数据仓库是面向主题的

主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类后进行分析利用的抽象。每一个主题都是决策者所关心的问题,如采购、产品生产、营销等。面向主题的数据组织方式,就是在较高层次上对分析对象数据的一个完整、一致的描述,能完整、统一地管理各个分析对象所涉及的企业各项数据及数据之间的联系。

2.数据仓库是集成的

数据仓库中存储的数据是从原来分散的各个业务子系统中提取出来的,但并不是原有数据的简单复制,而是经过了统一并综合。这是因为:①原始数据库系统记录的是每一项业务处理的流水账,这些数据不适合分析处理,在进入数据仓库之前必须经过综合、计算,抛弃不需要的数据,增加可能涉及的外部数据;②源数据在原分散数据库中有许多重复、不一致或错误,必须将这些数据转换成全局统一的定义,消除不一致和错误之处,保证数据质量。

3.数据不可更新

从数据的使用方式上看,由于分析的需要,数据仓库中的数据反映了客观世界的历史真实性,它是不同历史时刻,不同地点数据库快照的集合以及基于这些集合的统计、汇总和重组所导出的数据。因此对它不能做任何的更新而只能做查询,这是保证决策正确的基础条件。

4.数据随时间不断变化

数据仓库数据的不可更新是针对应用而言的,即用户分析处理时不更新数据。但不是说,数据从进入数据仓库之后就永远不变,这些数据随时间变化而定期更新。每隔一段固定的时间间隔后,抽取运行数据库系统中产生的数据,转换后集成到数据仓库中。

5.数据的集合性

数据的集合性是指数据仓库必须以某种数据集合的形式存储起来,数据仓库采用的数据集合方式主要有以多维数据库方式存储的多维模式、以关系数据库方式存储的关系模式,以及多维模式和关系模式混合的模式。

6.决策支持作用

决策支持作用是数据仓库一个核心的应用,建立数据仓库的目的是将企业多年来收集到的数据按照一个统一的规则组织存储,然后通过对海量的数据进行分析提供决策支持,帮助企业及时、准确地把握机会,以在激烈的市场竞争中取得最大的利润。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。