数据仓库中的ODS有什么用途 答案: ODS(Operational Data Store)操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复...
简要解释数据集市(DM)和数据仓库(DW)的用途
1)DM 请简要解释DM的用途 答案: DM(Data Mart)也称数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据,可以认为是一个局部的数据仓...
如何评价特征子集的好坏?如何制定特征选择的停止准则?
如何评价特征子集的好坏 答案: 有比较多的评价函数可以用于评价特征子集的好坏,评价函数主要用来度量一个特征(或者特征子集)可以区分不同类别的能力,使用不同的度量方法最终得到的特征子集也不一样。一个特征...
有哪些方法可以用于生成候选特征子集?各有什么特点?
特征选择不仅可以减少特征数量、降维,使模型泛化能力更强,减少过拟合,还可以增强对特征和特征值之间的理解。 我们需要区别两个概念,一个是特征选择(feature selection),是指从 n 维空间...
基于特征选择的数据降维方法有哪些?
特征选择不仅可以减少特征数量、降维,使模型泛化能力更强,减少过拟合,还可以增强对特征和特征值之间的理解。 我们需要区别两个概念,一个是特征选择(feature selection),是指从 n 维空间...
为什么要对数据进行降维?有哪些数据降维方法?
降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。 降维的结果是图像越来越不清晰,最后只剩下轮廓。 在面对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,此时需要进行...

什么是时间系列螺旋图?
连续型时间数据在任意两个时间点之间可以细分出无限多个数值,它是连续不断变化现象的记录。例如,温度是人们最常接触的连续型时间数据,一天内任意一个时刻的温度都可以被测量到。 螺旋图 螺旋图也称为时间系列螺...
什么是统计分组的穷尽性原则和互斥性原则?
统计分组是对总体各单位的分类,是整理统计资料的方法,也是统计分析的基础。因此,除了在内容各方面必须反映各单位、各组之间的性质差异外,还要在方法上保证资料的完整性和真实性,这是对统计分组的最基本的要求。...
什么是品质数据?什么是数量数据?
统计数据不论其来源如何,都是对客观现象进行计量的结果,对其属性、特征进行分类、标示和计算,称为统计量度或统计测定。由于客观事物有的比较简单,有的比较复杂,有的特征和属性是可见的(如人的外貌体征),有的...
什么是分类型品质数据?什么是顺序型品质数据?
品质数据是定性测定的结果,它是说明事物属性特征的统计数据,用文字来表现。由于定性测定又可分为定类测定和定序测定,因而,品质数据又可区分为分类型品质数据和顺序型品质数据两种。 1.分类型品质数据 分类型...
什么是描述型数据挖掘?什么是预测型数据挖掘?
数据挖掘的任务是从数据中发现模式,模式按功能分为描述型挖掘和预测型挖掘。 描述型挖掘是对数据中存在的规则做一种描述,或者根据数据的相似性把数据分组。它是刻画目标数据中数据的一般性质,概括数据中潜在的联...

数据仓库的开发策略有哪六种模式?
数据仓库的开发策略有六种模式,如图3-19所示。 自上而下模式是先构建企业范围内的数据仓库,然后根据各个业务过程的需求分析,将数据仓库内的数据调入数据集市进行分析。此模式从企业整体出发,考虑到各个主要...

什么是数据仓库的星形模式和雪花模式?
数据仓库的逻辑模型通常有星型模式和雪花模式两种基本结构。 (1)星形模式(Star Schema) 星形模式是以唯一的事实表为中心,由若干个维度表与其相连。在图3-17中,事实表是销售表,维表有产品维...

什么是从属的数据集市?什么是独立的数据集市?
1.数据集市的定义 作为具有特定应用的数据仓库,数据集市(Data Mart, DM)从数据源中收集数据,是企业数据仓库的一个子集。数据集市作为部门级的数据仓库,一般只能为某个局部范围内的管理人员服务...

数据仓库与传统数据库的比较
企业的数据处理大致分为两类,一类是数据操作处理,也称为联机事务处理(OnLine Transaction Processing, OLTP),是数据库管理系统的主要功能,它涵盖了企业的大部分日常操作,...
精益数据产品是什么意思?精益数据产品的原则?
1.精益数据产品的定义 精益数据产品是遵从精益数据方法,以数据为要素,利用数字化技术,解决业务问题,创造客户价值,具备数据运营和快速迭代能力的数据产品。 精益数据产品有以下四大特质。 (1)用户有获得...

数据即服务是什么意思?什么是数据即服务类产品?
数据即服务,指将数据直接当作一种服务提供给用户。这是数据作为生产要素的主要应用形式。比如,大数据交易所提供的各类数据集和算法就是数据即服务类产品的典型代表。 数据即服务类产品有以下5种最终提供服务的方...

什么是数据增强类产品?什么是数据洞见类产品?
1.数据增强类产品 数据增强类产品是指利用数据智能技术来提升竞争力的实体结合数据的产品。现在所有的产品都在努力成为数据增强类产品,以便获得数据产品的8个升维优势。数据增强类产品示例如图4-3所示。 其...
数据管理技术的发展历程
数据管理活动是伴随着数据的产生而产生的。可以说,数据管理经历了一个漫长的过程。从技术角度来说,数据管理技术的发展大体可归为3个阶段。 人工管理阶段(20世纪50年代中期以前),计算机主要用于科学计算,...
什么是数据管理?什么是数据治理?
1 数据管理 伴随20世纪80年代数据随机存储技术和数据库技术的使用,计算机系统中的数据可以被方便地存储和访问,数据管理的概念随之被提出。根据国际数据管理协会(Data Management Asso...