可视分析学被定义为一门由可视交互界面为基础的分析推理科学。它综合了图形学、数据挖掘和人机交互等技术,如图6-7a所示,以可视交互界面为通道,将人的感知和认知能力以可视的方式融入数据处理过程,形成人脑智能和机器智能的优势互补与相互提升,建立螺旋式信息交流与知识提炼途径,完成有效的分析推理和决策。
图6-7 可视分析学
a)可视分析的学科交叉组成 b)可视分析学涉及的学科
新时期科学发展和工程实践的历史表明,智能数据分析所产生的知识与人类掌握的知识的差异正是导致新的知识发现的根源,而表达、分析与检验这些差异必须由人脑智能地参与。另一方面,当前的数据分析方法大都基于先验模型,用于检测已知的模式和规律,对复杂、异构、大尺度数据的自动处理经常会失效,例如,数据中蕴含的模式未知,搜索空间过大,特征模式过于模糊,以及参数很难设置等。而人的视觉识别能力和智能恰好可以辅助解决这些问题。另外,自动数据分析的结果通常带有噪声,必须人工干预。为了有效结合人脑智能与机器智能,一个必经途径是以视觉感知为通道,通过可视交互界面,形成人脑和机器智能的双向转换,将人的智能,特别是“只可意会,不能言传”的人类知识和个性化经验可视地融入到整个数据分析和推理决策过程中,使得数据的复杂度逐步降低到人脑和机器智能可处理的范围。这一过程逐渐形成了可视分析这一交叉信息处理新思路。
可视分析学可看成将可视化、人的因素和数据分析集成在内的一种新思路。如图6-7b所示,诠释了可视分析学包含的研究内容。其中,感知与认知科学研究人在可视化分析学中的重要作用;数据管理和知识表达是可视分析构建数据到知识转换的基础理论;地理分析、信息分析、科学分析、统计分析和知识发现等是可视分析学的核心分析论方法;在整个可视分析过程中,人机交互必不可少,用于驾驭模型构建、分析推理和信息呈现等整个过程。可视分析流程中推导出的结论与知识最终需要向用户传播和应用。
可视分析学是一门综合性学科,与多个领域相关。在可视化方面,有信息可视化、科学可视化与计算机图形学。与数据分析相关的领域包括信息获取、数据处理和数据挖掘。而在交互方面,则由人机交互、认知科学和感知等学科融合。可视分析的基础理论和方法仍然是正在形成、需要深入探讨的前沿科学问题,在实际中的应用仍在迅速发展中。
下面介绍几个可视分析软件。
1.GapMinder
GapMinder Trendalyzer是瑞士GapMinder基金会开发的一个用于分析时变多变量数据变化趋势的可视分析软件。它采用互动的可视化形式动态地展示了世界各地、各机构公开的各项人文、政治、经济和发展指数,在信息产业界产生了积极的影响。2007年,Google公司向GapMinder基金会购买了Trendalyzer,并进行了自己的开发和功能拓展。通过Google GapMinder,用户可以查看1975~2004年世界上各国人口发展和GDP发展的动态变化图像。
2.Google Public Data Explorer
Google Public Data Explorer使用Google的Dataset Publishing Language(DSPL)数据发布语言,支持各类数据库链接,进行可视化的定制。它的优点是上传接口简单易行,所有操作都在网页上完成,而可视化的结果则以Flash的形式展现,并且允许用户嵌入到第三方网站中或者分享给其他用户,基本满足普通用户的统计数据分析需求。
3.Palantir
Palantir是可视分析领域的标杆性软件,为政府机构和金融机构提供高级数据分析服务。Palantir的主要功能是链接网络各类数据源,提供交互的可视化界面,辅助用户发现数据间的关键联系,寻找隐藏的规律或证据,并预测将来可能发生的事件。