数据仓库与数据库的区别

2021年7月21日17:12:52数据仓库与数据库的区别已关闭评论

在大数据出现之前,数据库在传统应用中,占据了十分重要的地位——所有业务数据的存储都使用数据库,因此也出现了MySQL、Access、DB2、Oracle、SQL Server等很多数据库和厂商。

数据库和数据仓库的相同点是:它们都是数据的存储方式。那它们有什么不同呢?

1.存储的内容不同

在传统的业务应用中,业务逻辑会随时来获取数据和修改数据,数据库里面需要时刻保持自己的数据是最新的(有一些数据库技术是用来保证毫秒级主从同步或多从库的状态一致)。而数据仓库中存储的是非常多的历史数据,如日志数据、业务应用的快照数据、工作组数据等。

2.用途不同

一套数据库一般是一套业务应用的存储介质,用来提供业务需要的数据。而数据仓库一般是使用大量的历史数据、相关维度、相关工具等一起来做分析工作,这种分析工作,可能会作为管理者决策支持的依赖,可能会是业务模式修改的依据、也可能是业务系统修改和变更的考量。

3.存取速度要求不同

数据库的存取速度直接影响到业务系统的访问速度,进而影响用户体验和业务表现,所以,数据库的存取速度一般要求很高(大部分都在毫秒级)。而分析工作一般会持续较长的一段时间,因此,这个分析工作是可以接受分钟级甚至几十分钟的延迟的。

4.存储的数据量不同

因为数据仓库存储了日志、业务系统快照等很多数据,所以它的数据量一般比数据库大很多。常见的业务应用数据库的存储量在MB到几百MB之间,而数据仓库一般在几百GB到几百TB甚至几十PB级别。随着大数据领域的发展,这个单位几年之后还会再经历几个翻翻。

5.存在时间不同

数据库里面只保存最新的业务数据,只要有新的请求过来,旧的数据就不复存在了。而在数据仓库中,数据一般是会保存数月至数年(一般由于审计需要,企业数据仓库至少要保存一年以上)。对于现在的大型IT公司来说,一般会把自成立起就依赖的所有数据当作资产来保存,以备未来不可预知的分析需要。

6.存取方式不同

业务系统会有各种操作,所以数据库的操作一般会包括增删查改,这种操作一般都是记录级的细小操作,而且并发度会很高(比如每秒几百次)。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。