数据仓库的整体架构
数据仓库(Data Warehousing)是一种能正确地组合与管理不同数据源的技术,其目的在于回答您业务经营上的问题以便让您做出正确决定。
数据仓库的整体架构如下:
数据仓库的基本架构及整体概念,我将它区分为以下几个基本组件说明:
专业顾问通过与企业需求访谈,建立数据仓库的模型,然后将企业的各种数据整合于数据库中,并安装前端分析数据的工具以及管理工具,这个过程即为构建数据仓库的基本过程。
❑设计:数据仓库的数据模型的设计,这部分是最重要的,若模型设计得不够周全或不理想,不论之后的报表设计如何精美,都有可能运行出错误的信息,这就是需要选择有经验的专业顾问设计数据仓库的一个重要原因。
❑整合:数据的整合转换过程,包含数据解释(Data Extraction)、数据转换(Data Transformation)、数据清理(Data Cleaning)、数据加载(Data Load),也就是将各种来源的数据整合转换加载到数据仓库中。数据转换程序的撰写不易,自动化处理困难,经常要人工参与作业,因此,约占DW项目60%~70%的人力及时间。
❑运作:数据仓库的中心,是一个容量巨大、用于提供ad-hoc查询的数据库。
❑可视化:前端呈现给用户看的形式,例如数据挖掘及OLAP工具,用以呈现分析过的数据形式。
❑管理:管理的工具,例如:网络监控流量、安全管理等。
图1-9是一个完整数据仓库的逻辑概要架构。
由IT用户将平日数据存入至数据库,通过多种数据转换工具将数据以各种转换方式整合到数据仓库。再由整体数据仓库使用数据复制、发布工具,根据需求将数据发布到部门性质数据仓库。用户可以用各种不同的信息存取方式及工具,完成各类业务的信息需求。