数据仓库 什么是操作型、集成型、分析型与历史数据区? 1 操作型数据区 操作型数据区主要是由以OLTP为主的操作型系统构成的,用于满足企业各个环节业务的正常运营需求。它与我们日常的生活最为相关。例如当我们登录购物网站的时候,购物下单的系统就是一个典型的操... 2024年6月25日什么是操作型、集成型、分析型与历史数据区?已关闭评论 阅读全文
数据仓库 什么是悲观锁(悲观并发控制PCC)与乐观锁? 锁是保证数据库数据一致性的基石。总的来看,锁分为悲观锁(Pessimistic Lock)和乐观锁(Optimistic Lock)两种形式。悲观锁实际上使用的是“先取锁再访问”的保守策略,为数据处理... 2024年6月25日什么是悲观锁(悲观并发控制PCC)与乐观锁?已关闭评论 阅读全文
什么是数据生命周期? 数据生命周期主要分为4个阶段,分别是数据创建、数据使用、数据归档与数据销毁。从字面意思就可以看出在这4个阶段中数据承担的主要角色。在进入数据生命周期之前,还有两个前置阶段,分别是业务规划阶段和应用设计... 2024年6月24日 数据仓库什么是数据生命周期?已关闭评论 阅读全文
数据仓库 常见的数据质量体系 数据质量管理(Data Quality Management)是指对从计划、获取、存储、共享、维护、应用、消亡这些生命周期的所有阶段中可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理... 2024年6月24日常见的数据质量体系已关闭评论 阅读全文
数据模型分为3类: 概念模型 、 逻辑模型 、物理模型 模型是对现实世界特征的模拟和抽象。 在数据库技术中,用数据模型的概念描述数据库的结构和语义,是对现实世界的数据抽象。数据模型是研究数据库技术的核心和基础,也是元数据的主要组成部分。 总的来说,数据模型... 2024年6月24日 数据仓库数据模型分为3类: 概念模型 、 逻辑模型 、物理模型已关闭评论 阅读全文
什么是周期快照事实表?什么是累积快照事实表? 事实表是指存储事实记录的表。事实表中的每行数据代表一个业务事件,如下单、支付、退款、评价等。“事实”这个术语表示的是业务事件中的度量,如可统计次数、个数、金额等。例如,2022年2月21日,小李在某网... 2024年5月4日 数据仓库什么是周期快照事实表?什么是累积快照事实表?已关闭评论 阅读全文
数据仓库 数据模型分为三种:星形模型、雪花模型与星座模型 在维度建模的基础上,数据模型又分为三种:星形模型、雪花模型与星座模型,其中最常用的是星形模型。 星形模型中有一张事实表,以及0个或多个维度表,事实表与维度表通过主键外键相关联,维度表之间没有关联。当所... 2024年5月4日数据模型分为三种:星形模型、雪花模型与星座模型已关闭评论 阅读全文
数据库和数据仓库的区别 现在的数据库通常指的是关系型数据库。关系型数据库通常由多张二元的表组成,具有结构化程度高、独立性强、冗余度低等特点。也正是由于关系型数据库的这些特点,其主要进行OLTP(Online Transact... 2024年5月4日 数据仓库数据库和数据仓库的区别已关闭评论 阅读全文
通过离散化变换数据的方法有哪些? (1)通过分箱离散化。 分箱是一种基于指定箱个数的自顶向下的分裂技术,而分箱离散化是一种无监督离散化方法,主要分为三类。 1)等宽分箱:将变量的取值范围分为 k 个等宽的区间,每个区间当作一个分箱。 ... 2024年4月2日 数据仓库通过离散化变换数据的方法有哪些?已关闭评论 阅读全文
4种标称数据的概念分层的产生方法 概念分层可以用来把数据变换到多个粒度值,下面是4种标称数据的概念分层的产生方法。 (1)由用户或专家在模式级显式地说明属性的部分序。通常分类属性或维的概念分层涉及一组属性,用户或专家在模式级通过说明属... 2024年4月2日 数据仓库4种标称数据的概念分层的产生方法已关闭评论 阅读全文
数据预处理的目的与意义 数据预处理(Data Preprocessing)是指在主要的数据处理之前对数据进行的一些处理,旨在解决数据中存在的问题,为后续的分析和建模提供高质量的数据。经过采集得到的原始数据主要有以下问题。 ●... 2023年10月23日 数据仓库数据预处理的目的与意义已关闭评论 阅读全文
数据仓库中的ODS有什么用途? 数据仓库中的ODS有什么用途 答案: ODS(Operational Data Store)操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复... 2023年5月24日 数据仓库数据仓库中的ODS有什么用途?已关闭评论 阅读全文
简要解释数据集市(DM)和数据仓库(DW)的用途 1)DM 请简要解释DM的用途 答案: DM(Data Mart)也称数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据,可以认为是一个局部的数据仓... 2023年5月24日 数据仓库简要解释数据集市(DM)和数据仓库(DW)的用途已关闭评论 阅读全文
什么是分类型品质数据?什么是顺序型品质数据? 品质数据是定性测定的结果,它是说明事物属性特征的统计数据,用文字来表现。由于定性测定又可分为定类测定和定序测定,因而,品质数据又可区分为分类型品质数据和顺序型品质数据两种。 1.分类型品质数据 分类型... 2023年4月7日 数据仓库什么是分类型品质数据?什么是顺序型品质数据?已关闭评论 阅读全文
数据仓库 数据仓库的开发策略有哪六种模式? 数据仓库的开发策略有六种模式,如图3-19所示。 自上而下模式是先构建企业范围内的数据仓库,然后根据各个业务过程的需求分析,将数据仓库内的数据调入数据集市进行分析。此模式从企业整体出发,考虑到各个主要... 2023年3月16日数据仓库的开发策略有哪六种模式?已关闭评论 阅读全文
数据仓库 什么是数据仓库的星形模式和雪花模式? 数据仓库的逻辑模型通常有星型模式和雪花模式两种基本结构。 (1)星形模式(Star Schema) 星形模式是以唯一的事实表为中心,由若干个维度表与其相连。在图3-17中,事实表是销售表,维表有产品维... 2023年3月16日什么是数据仓库的星形模式和雪花模式?已关闭评论 阅读全文
数据仓库 什么是从属的数据集市?什么是独立的数据集市? 1.数据集市的定义 作为具有特定应用的数据仓库,数据集市(Data Mart, DM)从数据源中收集数据,是企业数据仓库的一个子集。数据集市作为部门级的数据仓库,一般只能为某个局部范围内的管理人员服务... 2023年3月16日什么是从属的数据集市?什么是独立的数据集市?已关闭评论 阅读全文
数据仓库 数据仓库与传统数据库的比较 企业的数据处理大致分为两类,一类是数据操作处理,也称为联机事务处理(OnLine Transaction Processing, OLTP),是数据库管理系统的主要功能,它涵盖了企业的大部分日常操作,... 2023年3月16日数据仓库与传统数据库的比较已关闭评论 阅读全文
数据仓库 C4.5算法的基本原理?C4.5算法与ID3算法的区别? ID3还存在许多需要改进的地方,于是,Quinlan在1993年提出了ID3算法的改进版本C4.5。C4.5算法的核心思想与ID3完全一样,它与ID3算法不同的地方包括: (1)划分度量采用增益率; ... 2023年1月11日C4.5算法的基本原理?C4.5算法与ID3算法的区别?已关闭评论 阅读全文
什么是数据库完整性:数据完整性的分类 数据库完整性(Database Integrity)是指数据库中数据的正确性和相容性,是确保数据库中数据一致、正确以及符合企业规则的一种思想,是使无序的数据条理化,确保正确的数据被存放在正确的位置的一... 2022年6月30日 数据仓库什么是数据库完整性:数据完整性的分类已关闭评论 阅读全文