Hadoop的特点特征

Hadoop的特点特征 Hadoop是开源的、应用最广、影响最大的大数据分布式处理框架,该软件具有以下特点。 (1)高可靠性:数据采用冗余存储方式,部分副本失效并不会影响数据的可用性。 (2)高扩展性...
阅读全文
Hadoop的发展历程 大数据

Hadoop的发展历程

Hadoop的发展历程 Hadoop的发展历程如图4-16所示。 图4-16 Hadoop的发展历程 从图4-16可以看出,Google是Hadoop的滥觞,道格·卡廷(Doug Cutting)是H...
阅读全文

MapReduce的工作流程

MapReduce的工作流程 MapReduce的工作流程如下所述。 (1)将一个大的运算作业拆分成许多个Map任务,并将其分配在多个服务器上并行处理。运行Map任务的服务器通常就是存储数据的服务器。...
阅读全文

数据可视化如何进行定量化描述

数据可视化如何进行定量化描述 数据可视化的定量化描述可以从表示数据的精确度的角度来描述,从最精确的到最不精确的表示形式的排序为位置、长度、角度、方向、面积、体积、饱和度、色调。 除此之外,对分类、定序...
阅读全文

数据可视化的工具软件有哪些

数据可视化的工具软件有哪些 数据可视化图形形式比较复杂,制作不易,但因其具有超强的表现力,所以受到了业界的追捧。幸运的是,在现有的很多数据可视化工具软件支持下,制作这些图形已然十分便捷,而且其中大部分...
阅读全文

数据可视化的设计要素

数据可视化的设计要素 形状和颜色构成了数据可视化的基本手段,将数据信息表示成图形元素和颜色的过程称为数据的可视化编码。数据信息与“形”“色”之间匹配的好坏是个技术问题,也是个应用问题,还兼有艺术问题。...
阅读全文
数据可视化的设计步骤 数据可视化

数据可视化的设计步骤

数据可视化的设计步骤 数据可视化设计属于应用软件设计,因此在设计过程中采取用户视角是至关重要的。另外一个要点是以数据为基础,即数据可视化是建立在数据之上的,必须先有大量的数据,再考虑其表现形式,而不是...
阅读全文

南丁格尔玫瑰图的来历

南丁格尔玫瑰图的来历 19世纪50年代,奥斯曼帝国、英国、法国和撒丁王国与俄罗斯帝国进行了克里米亚战争。当时战地医院的卫生条件极差,各种资源极度匮乏,英军伤病员的死亡率高达42%。英国女护士弗洛伦斯·...
阅读全文

Redis的功能与特点

Redis的功能与特点 Redis是一个开源的、支持网络、高性能的键值数据库。Redis源于远程字典服务器(Remote Dictionary Server),使用ANSI C语言编写,并提供多种语言...
阅读全文

Berkeley DB的功能与特点

Berkeley DB的功能与特点 Berkeley DB是历史悠久的嵌入式数据库系统。Berkeley DB的第一个发行版出现于1991年;1992年,BSD UNIX第4.4发行版中包含了Berk...
阅读全文

Memcached的功能与特点

Memcached的功能与特点 Memcached(http://memcached.org/)是由LiveJournal旗下的Danga Interactive公司开发的开源高性能键-值对型内存数据...
阅读全文

文档数据库MongoDB的功能与特点

文档数据库MongoDB的功能与特点 MongoDB是一个基于分布式文件存储的开源数据库系统,它是介于关系型数据库和非关系型数据库之间的产品,在非关系型数据库当中功能最丰富,最像关系型数据库。它支持的...
阅读全文
列族数据库HBase的四维模型 大数据

列族数据库HBase的四维模型

列族数据库HBase的四维模型 实际上,HBase是一个列族数据库,而不是真正的列式数据库。 因为允许存放非结构化数据,所以HBase的数据类型只有简单的字符串类型,如果需要细分类型,需要用户自己处理...
阅读全文

什么是列式数据库HBase:行式存储与列式存储的区别

什么是列式数据库HBase:行式存储与列式存储的区别 列式数据库中的数据是按列存储的,而传统的关系数据库是按行存储的。这一区别与中国古代书写规则是从上到下从右到左按列顺序书写,而现代书写规则是从左到右...
阅读全文

Google数据库BigTable的功能与特点

Google数据库BigTable的功能与特点 据说早在2005年,Google公司的很多项目数据都存放在BigTable中,如搜索、地图、社交网站Orkut、视频共享网站YouTube和博客网站Bl...
阅读全文

Hadoop分布式文件系统(HDFS)的缺陷与弱点

Hadoop分布式文件系统(HDFS)的缺陷与弱点 尽管HDFS已经有十分广泛的应用市场,但受限于其最初的设计理念,也由于它毕竟只是一个文件系统,不可避免地存在一些不足之处。 (1)不适合实时性很强的...
阅读全文

Hadoop分布式文件系统(HDFS)的安全设计

Hadoop分布式文件系统(HDFS)的安全设计 HDFS认为硬件出错是一种常态,因此要求文件管理系统有较高的容错性。HDFS有多种硬件容错办法。下面按命名节点出错、数据节点出错和数据出错3种情况介绍...
阅读全文

Hadoop分布式文件系统(HDFS)的设计原则

Hadoop分布式文件系统(HDFS)的设计原则 在HDFS设计之初,设计者非常有远见,明确地设定了如下设计原则。 (1)存储超大文件:HDFS要能够管理超大容量的文件,典型的文件容量是从GB级别到T...
阅读全文

Hadoop分布式文件系统(HDFS)的基本术语:数据块、节点、客户端和通信协议

HDFS的基本术语包括数据块、命名节点、数据节点、从命名节点、命名空间、客户端和通信协议。 1. 数据块 文件系统管理数据的最小单位不是字节,而是数据块。在大数据环境下,管理的文件体量大幅度增加,数据...
阅读全文