数据中心的组成元素有哪些?

数据中心一般定义为一个可以对信息或数据进行集中存储、处理、交换、传输及管理的机房,涉及的物理基础设施一般包括关键主设备和基础支撑设备。关键主设备的主要任务是实现计算和通信功能,包括服务器、存储设备和网...
阅读全文
什么是数据中心的总体架构? 大数据

什么是数据中心的总体架构?

数据中心是应用服务、数据资源、网络互联、基础设施的复杂综合体,通常分为基础设施层、信息资源层、应用支撑层、应用层和辅助系统层5个层面,数据中心总体架构如图1-8所示。 图1-8 数据中心总体架构 1....
阅读全文

分布式存储系统的类型有哪些?

根据存储数据类型的不同以及I/O读写速度的差异,分布式存储系统具有结构化存储系统、非结构化存储系统、半结构化存储系统和内存缓存系统4种类型。 1.结构化存储系统 结构化数据是一种用户定义的数据类型,它...
阅读全文

大数据的分布式存储有哪些特点?

分布式存储系统是分布式系统3个研究方向(分布式存储系统、分布式计算系统和分布式管理系统)中的一个重要分支。顾名思义,分布式存储系统就是将大量的普通服务器(一般为廉价的硬件)作为数据存储设备(不是专用的...
阅读全文

大数据清洗的基本方法有哪些?

顾名思义,数据清洗就是把“脏”的“洗掉”,是发现和纠正数据文件中可识别的错误的过程,如检查数据一致性,处理无效值和缺失数据等。针对原始数据中所出现的数据问题以及业务需求的不同,数据清洗所采取的方法和策...
阅读全文

数据管理技术的发展历程

数据管理活动是伴随着数据的产生而产生的。可以说,数据管理经历了一个漫长的过程。从技术角度来说,数据管理技术的发展大体可归为3个阶段。 人工管理阶段(20世纪50年代中期以前),计算机主要用于科学计算,...
阅读全文

Spark与Hadoop的比较

Spark是在借鉴了MapReduce之上发展而来的,继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷,具体如下: 首先,Spark把中间数据放到内存中,迭代运算效率高。MapRedu...
阅读全文
数据清洗的基本原理 大数据

数据清洗的基本原理

数据清洗是发现并纠正数据文件中可识别的错误的最后一道程序,包括对数据一致性的检查、无效值和缺失值的处理。 数据清洗的原理是利用有关技术如数据挖掘或预定义的清理规则将脏数据转化为满足数据质量要求的数据(...
阅读全文

数据采集有哪些常用方法

(1)系统日志采集方法 很多互联网企业都有自己的海量数据采集工具,多用于系统日志采集,如Hadoop的Flume、Kafka的Sqoop等,这些工具均采用分布式架构,能满足每秒数百MB的日志数据采集和...
阅读全文
GeoGebra软件的数值类对象 大数据

GeoGebra软件的数值类对象

GeoGebra的数值类对象有数字、角度、布尔值,它们都可以看作是用一个单纯的数表示的。 1 数字 数字是GeoGebra中最基本的对象类型,包括整数、有理数、实数(GeoGebra不能直接表示复数,...
阅读全文
GeoGebra软件的几何类对象 大数据

GeoGebra软件的几何类对象

GeoGebra中的几何类对象是指欧式空间中的几何图形,其涵盖了平面几何和立体几何中的常见对象。几何类对象的操作是GeoGebra中最常用的功能。GeoGebra的工具栏提供了数量众多的几何工具图标,...
阅读全文