数据可视化的工具软件有哪些
数据可视化图形形式比较复杂,制作不易,但因其具有超强的表现力,所以受到了业界的追捧。幸运的是,在现有的很多数据可视化工具软件支持下,制作这些图形已然十分便捷,而且其中大部分工具是开源的,可以满足各种数据可视化需求。
根据用途的不同,可以将数据可视化工具分成如下5类,即入门级工具、信息图表工具、地图工具、时间线工具、专业级工具。
(1)入门级工具:Excel、Google Spreadsheets。
(2)信息图表工具:Google Chart API、D3、Visual.ly、Tableau、大数据魔镜。
(3)地图工具:Google Fusion Tables、Modest Maps、Leaflet。
(4)时间线工具:Timetoast、Xtimeline。
(5)专业级工具:R、Weka、Gephi。
1. 入门级工具
Excel是一款使用广泛的电子表格软件,简单易学,是数据可视化入门级工具。
Excel的可视化表现形式比较丰富,除了常见的柱状图、饼图、折线图、散点图、面积图,还有雷达图、箱线图、瀑布图、树状图和漏斗图等。2013版本以后,Excel拥有Map Power地图绘制功能,结合Bing地图,支持用户绘制可视化的地理和时态数据,并用3D方式进行分析,同时还可以实现动态效果并创建视频。
但是,如果要进行专业的数据分析,或者制作公开发表的图表,不建议使用Excel。
Google Spreadsheets可以看作谷歌版的Excel。
2. 信息图表工具
信息图表是数据可视化最常用的工具之一。
Google Chart API支持圆饼图、曲线图、折线图、柱状图、散点图、地质图、树映射、Table、组合图、阴阳烛图等。它取消了静态图片功能,目前只提供动态图表工具。它存在的问题是,图表在客户端生成,这就意味着不支持JavaScript的设备将无法使用该软件。
D3(Data-Driven Document)是一个JavaScript函数库,可以生成互动的图像,此处所谓的Document即文档对象模型(DOM)。D3允许用户绑定任意数据到DOM,然后根据数据来操作DOM,从而创建可交互式的图像。D3能够提供非常复杂的图表(可以登录http://d3js.org/网站查看)。
Visual.ly将自己定义为“信息图设计师的在线集市”。用Visual.ly制作信息图并不复杂,它是一个自动化工具。用户只要注册Visual.ly,然后登录http://create.visual.ly/,便可以尝试制作自己的信息图。但是,目前只能通过Twitter、Facebook、Google等账户链接到其Visual.ly账户中。
与Excel一样,Tableau也是一款很容易上手的数据分析软件,它具有很好的可视化方式和交互操作性,只需要导入数据,通过简单的点选、拖曳即可生成图表。Tableau当然比Excel功能要强大许多,其产品也很丰富,包括制作报表、视图和仪表盘的Tableau Desktop,适合企业部署的Tableau Server,移动终端使用的Tableau Mobile,以及适合网上创建和分享数据的Tableau Public等。Tableau是商用的软件,只有Tableau Public是免费的,但要求把数据保存到它的服务器上。相对而言,Tableau的数据分析能力不算强。
大数据魔镜是国云数据旗下的一款开源大数据可视化分析工具(http://www.moojnn. com/),是基于Java平台开发的可扩展、自助式分析、大数据分析产品,拥有丰富的可视化效果,有500多种图形库,操作简单,用户体验良好。目前,大数据魔镜已拥有1万多家客户,包括中国移动、中国联通、中石油、伊利、中国海油、中国外运、1号店、苏宁易购、好享购等行业巨头。
3. 地图工具
地图工具在数据可视化中较为常见。如果数据与空间或地理分布相关,这是首选工具。
Google Fusion Tables是一个免费分享数据的网络工具,可用于国际科学研究合作。这一工具可以让数据呈现为图表、图形和地图等形式,使用者可以上传数据,并让任何人免费获得它们。与Excel相比,它可以管理更大容量的数据,着重于对数据进行批量操作(如分类、筛选、聚合、合并等)。
Modest Maps是一个很小的地图库,只有10KB大小,是目前最小的可用地图库,但这并不意味着Modest Maps仅提供一些基本的地图功能。事实上,在一些扩展库(如Wax)的配合下,Modest Maps立刻会变成一个强大的地图工具。
Leaflet是一个开源的JavaScript库,用于创建对移动设备友好的交互式地图。Leaflet是另一个小型化的地图框架,通过小型化和轻量化来满足移动网页的需要。Leaflet和Modest Maps都是开源项目,均有强大的社区支持,是在网站中整合地图应用的理想选择。
4. 时间线工具
时间线是表现数据在时间维度演变的有效方式,可以依照时间顺序,将事件的各方面串联起来,从而形成一个整体图文。常用的时间线工具有Timetoast和Xtimeline。
5. 专业级工具
R是一个非常复杂的、可用于分析大数据集的统计组件包,但需要较长的学习实践才能掌握。R拥有强大的社区和组件库,而且还在不断成长。当设计者能驾驭R时,会发现一切付出都是物有所值的。
与Tableau对比,R有如下不同之处。
(1)从开发的角度讲,Tableau开发上手容易、效率高,只要有Excel的基础,1天内就可以上手Tableau;但R是完全靠代码实现的,需要单独理解和学习一下R脚本。
(2)从使用角度讲,Tableau可以实现交互式报表,让用户自己参与和发现问题,数据可视化效果当然也比R要绚丽很多;R通常是一份静态的统计报告,交互性差,尤其是对不懂统计学的用户,理解起来难度较高。
(3)从架构上讲,Tableau是C/S开发,B/S访问,用户只需安装浏览器即可完成报表的浏览;但R是C/S开发,若有用户需要使用,则每个用户均需要安装一个R软件。
(4)从费用上讲,Tableau为商业软件,而R为开源软件。
(5)从目的上讲,Tableau适合将结果用图形化的方式表达出来,而R适合数据探索和数据挖掘。当然,在Tableau中也可以调用R的算法。
Weka是一款开源的、基于Java环境的机器学习和数据挖掘软件,集成了大量的机器学习算法,包括对数据的预处理、分类、回归、聚类、关联规则,以及交互式的可视化功能等。
Gephi是进行社交图谱数据可视化分析的工具,不仅能处理大规模数据集并生成漂亮的可视化图形,还能对数据进行清洗和分类。Gephi是一种非常特殊的软件,也非常复杂,先于他人掌握Gephi将使你一骑绝尘。