信息可视化处理的对象是抽象的、非结构化的数据集合(如文本、图表、层次结构、地图、软件和复杂系统等)。与科学可视化相比,信息可视化更关注于抽象、高维的数据。传统的信息可视化起源于统计图形学,与信息图形、视觉设计等现代技术相关,其表现形式通常在二维空间,因此关键问题是在有限的展示空间中以直观的方式传达抽象信息。在大数据爆炸时代,信息可视化面临巨大的挑战:在海量、动态变化的信息空间中辅助人类理解和挖掘信息,从中检测预期的特征,并发现未预期的知识 。
下面介绍几个信息可视化应用软件。
1.CiteSpace
CiteSpace是由可视化专家Chaomei Chen 教授开发的一款文献分析的可视化软件,主要面向科研论文之间相互引用所构成的网络。CiteSpace的数据来源于Web of Science,分析过程包括确定主题词和专业术语、收集数据、提取研究前沿术语、时区分割、阈值选择、显示、可视检测和验证关键点8个步骤。CiteSpace系统适用的用户群广泛,包括科学家、科技政策研究者和搞科研的学生,可用它进行学科发展趋势和发展过程中的重要变化的探测和可视化研究。
2.D3 ( Data Driven Documents )
Data Driven Documents(D3)是一套面向Web的二维数据变换与可视化方法。它以轻量级的浏览器端应用为目标,具有良好的可移植性。D3.js是基于D3规范的JavaScript库,基于HTML、SVG(向量图形)和CSS构建,前身是美国斯坦福大学研发的Protovis(目前已停止更新)。D3可以将任意数据绑定到一个DOM,并对文档实施基于数据的变换。例如,将一组数字生成为一个HTML表,或用相同的数据生成一个可交互的SVG条形图。
D3的特点在于它提供了基于数据的文档高效操作,这既避免了面向不同类型和任务设计专有可视表达的负担,又能提供设计灵活性,同时发挥了CSS3、HTML 5和SVG等Web标准的最大性能。自问世以来,D3在学术界和工业界都被广泛使用,产生了很大影响。
3.Gephi
Gephi是一个应用于各种网络、复杂系统和动态分层图的交互可视化和探索平台,支持Windows、Linux和Mac等各种操作系统。Gephi可用于探索性数据分析、链接分析、社交网络分析和生物网络分析等,其设计初衷是采用简洁的点和线描绘与呈现丰富的世界。
Gephi从各个方面对图及大图的可视化进行了改进,并使用图形硬件加速绘制。Gephi提供了各类代表型图的布局方法,并允许用户自行设定布局。此外,Gephi在图的分析中加入了时间轴以支持动态的网络分析,提供交互界面支持用户实时过滤网络,通过过滤结果建立新网络。Gephi使用聚类和分层图的方法处理较大规模的图,通过加速编辑大型分层结构图来探究多层图,如社交社区、生化路径和网络交通图;利用数据属性和内置的聚类算法聚合图网络。Gephi处理的图规模上限约为50000个节点和1000000边。