数据仓库中的数据组织
数据仓库中的数据组织方式与数据库不同,通常是采用分级的方式进行组织。一般分为早期细节级、当前细节级、轻度综合级、高度综合级以及元数据5部分。
数据源经过综合后,首先进入当前细节级,并根据具体需要进行进一步综合,从而进入轻度综合级乃至高度综合级,老化的数据将进入早期细节级。数据仓库中存在着不同的数据综合级别,将其称为“数据粒度”。
(1) 早期细节数据存储过去的详细数据,反映真实的历史情况,这类数据随着时间的增加,数据量很大,使用频率低,一般存储在转换介质(如磁带)中。
(2) 当前细节数据存储最近时期的业务数据,反映当前业务的情况,数据量大,是数据仓库用户最感兴趣的部分。随着时间的推移,当前细节数据由数据仓库的时间控制机制转为早期细节数据。
(3) 轻度综合数据是从当前的基本数据中提取出来,通常以较小的时间段(粒度)统计而成的数据,其数据量较当前细节级数据少得多。
(4) 高度综合级的数据十分精炼,是一种准决策数据。