数据中心一般定义为一个可以对信息或数据进行集中存储、处理、交换、传输及管理的机房,涉及的物理基础设施一般包括关键主设备和基础支撑设备。关键主设备的主要任务是实现计算和通信功能,包括服务器、存储设备和网...

什么是数据中心的总体架构?
数据中心是应用服务、数据资源、网络互联、基础设施的复杂综合体,通常分为基础设施层、信息资源层、应用支撑层、应用层和辅助系统层5个层面,数据中心总体架构如图1-8所示。 图1-8 数据中心总体架构 1....

举例说明什么是社交网络可视化?
社交网络是指基于互联网的人与人之间的相互联系、信息沟通和互动娱乐的运作平台。例如Facebook、Twitter、微信、新浪微博、人人网、豆瓣等,都是当前普及的社交网站。通过社交网络能够很容易看出一个...

举例说明什么是背景数据的可视化?
在大数据时代,人们不仅要处理海量的数据,同时还要对这些数据进行加工、传播、分析和分享。目前,实现这些形式比较好的方法就是大数据可视化。数据可视化是关于数据视觉表现的形式,如柱状图、饼状图、直方图、散点...

举例说明什么是数据关系的可视化?
在大数据时代,人们不仅要处理海量的数据,同时还要对这些数据进行加工、传播、分析和分享。目前,实现这些形式比较好的方法就是大数据可视化。数据可视化是关于数据视觉表现的形式,如柱状图、饼状图、直方图、散点...

举例说明什么是指标的可视化?
在大数据时代,人们不仅要处理海量的数据,同时还要对这些数据进行加工、传播、分析和分享。目前,实现这些形式比较好的方法就是大数据可视化。数据可视化是关于数据视觉表现的形式,如柱状图、饼状图、直方图、散点...

举例说明什么是数据的可视化?
数据的可视化主要是借助于图形化手段,清晰有效地传达与沟通信息。为了有效地传达思想、概念,需要美学与功能齐头并举,直观传达关键特征,从而实现对于相当稀疏而又复杂数据集的深入洞见。因此,数据可视化的核心是...
分布式存储系统的类型有哪些?
根据存储数据类型的不同以及I/O读写速度的差异,分布式存储系统具有结构化存储系统、非结构化存储系统、半结构化存储系统和内存缓存系统4种类型。 1.结构化存储系统 结构化数据是一种用户定义的数据类型,它...
大数据的分布式存储有哪些特点?
分布式存储系统是分布式系统3个研究方向(分布式存储系统、分布式计算系统和分布式管理系统)中的一个重要分支。顾名思义,分布式存储系统就是将大量的普通服务器(一般为廉价的硬件)作为数据存储设备(不是专用的...
大数据的集中式存储有哪些优点缺点?
自从20世纪60年代大型和超大型主机问世之后,凭借其超强的计算和I/O处理能力以及在稳定性、安全性方面的卓越表现,在很长一段时间内,大型主机引领了计算机行业以及商业计算领域的发展。在大型主机时代,由于...
大数据清洗的基本方法有哪些?
顾名思义,数据清洗就是把“脏”的“洗掉”,是发现和纠正数据文件中可识别的错误的过程,如检查数据一致性,处理无效值和缺失数据等。针对原始数据中所出现的数据问题以及业务需求的不同,数据清洗所采取的方法和策...

什么是数据分析采用的象限分析法?
象限分析法是指以两个或多个维度为坐标并划分出不同象限,不同象限表示不同的价值导向。象限分析法是典型的策略驱动思维,常见于市场分析、产品分析、客户管理等。 例如,图1-2所示为一个购物平台分析客户群体的...
什么是数据分析采用的对比分析法?
对比分析法是指通过对比两组或多组数据来直观地体现事物的差异或变化,这是一种很常见的分析方法。 对比分析法首先要根据问题确定对比的指标,例如分析一款软件在计算机和手机上的注册用户情况,可以比较注册用户数...
什么是数据分析采用的公式拆解法?
公式拆解法是指对某一指标用公式层层拆解并分析其影响因素。公式拆解法借助公式的形式,对影响指标的因素层层抽丝剥茧,最终找出核心问题的所在。使用公式拆解法时,需要先确定表明问题的关键指标,然后层层拆解。如...
数据仓库中的ODS有什么用途?
数据仓库中的ODS有什么用途 答案: ODS(Operational Data Store)操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复...
简要解释数据集市(DM)和数据仓库(DW)的用途
1)DM 请简要解释DM的用途 答案: DM(Data Mart)也称数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据,可以认为是一个局部的数据仓...
如何评价特征子集的好坏?如何制定特征选择的停止准则?
如何评价特征子集的好坏 答案: 有比较多的评价函数可以用于评价特征子集的好坏,评价函数主要用来度量一个特征(或者特征子集)可以区分不同类别的能力,使用不同的度量方法最终得到的特征子集也不一样。一个特征...
有哪些方法可以用于生成候选特征子集?各有什么特点?
特征选择不仅可以减少特征数量、降维,使模型泛化能力更强,减少过拟合,还可以增强对特征和特征值之间的理解。 我们需要区别两个概念,一个是特征选择(feature selection),是指从 n 维空间...
基于特征选择的数据降维方法有哪些?
特征选择不仅可以减少特征数量、降维,使模型泛化能力更强,减少过拟合,还可以增强对特征和特征值之间的理解。 我们需要区别两个概念,一个是特征选择(feature selection),是指从 n 维空间...
为什么要对数据进行降维?有哪些数据降维方法?
降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。 降维的结果是图像越来越不清晰,最后只剩下轮廓。 在面对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,此时需要进行...