信息可视化可分为一维线性数据、二维数据、三维数据、多维数据、时态数据、层次数据和网络数据的可视化 7 类。在信息可视化中,从原始数据到用户,中间要经历一系列数据变换。数据转换把原始数据映射为数据表;可视化映射把数据表转换为结合了空间基、标记和图形属性的可视化结构。
(1)一维线性数据。
以一维线性方式组织的数据,如数据库、文本等。早期处理一维大数据集的方法,一是双焦显示,这种方法为所关注的区域提供了详细的信息,而很少提供上下文区域的信息;二是用大小固定且类似滚动条的空间上显示大量数据项的属性值。
(2)二维数据。
二维数据又称平面数据,数据集中的对象具有形状、大小、颜色等特征,如平面布局图、地图和报纸版面布局等。二维数据的可视化方式可以避免语言处理带来的脑力工作,对信息检索和知识挖掘非常有利,在研究和商业领域有着广阔的应用前景。ThemeView 是一种对大型文档集合之间的关系进行可视化的工具,它用显示山峰与山谷的自然地形图表示大型文档集合中的各个主题及相关信息的分布情况。
(3)三维数据。
信息可视化对三维数据的处理,主要集中在数据对象的体积、表面积、位置、方向、遮挡与导航等方面。采用的技术包括总览法、地标法、透视法、色彩编码法、透明法和多重显示等。目前,三维数据的可视化主要应用在医学影像、建筑CAD、机械设计、科学仿真等领域。
(4)多维数据。
多维数据的可视化是将具有 n (3 个以上)个属性的数据对象映射为 n 维空间中的标记。主要的任务包括发现模式、集簇、变量之间的关系、偏差和孤立点。多维数据一般通过降维技术映射到二维或三维可视化空间,如使用动态的二维图实现多维数据的缩放、色彩编码、动态查询等功能;如使用三维的分布图,则要注意方向迷失和遮挡给用户认知和操作带来的困难。分层聚类、 K -平均(K-means)聚类等方法是常用和有效的多维数据可视化技术。
(5)时态数据。
时态数据的特征是所有的数据对象都具有一个生命周期,并且对象之间在时间上会存在叠加的现象。主要的任务包括查找某一时刻及附近时域的信息、周期现象的比较。在项目管理领域,时态数据可视化的代表工具是 TimeSearcher,它把多个时间序列或其他线性数据序列结合起来进行分析。时态数据的可视化主要应用在期货市场需求分析、地震预测和生物电信号分析等领域。
(6)层次数据。
数据对象的集合呈现树形结构和层次结构,而且每个叶节点都具有一个父节点(根节点除外),节点和节点之间的连接包含着多个属性。Windows 操作系统通常采用树形结构来浏览文件,其他文件浏览器也有采用兴趣度树、空间树、双曲线浏览器等可视化方法。近来,一种在给定矩形平面通过填充任意大小树形结构的显示方法——树图,在市场分析、产品目录搜索、农产量监测等领域得到了广泛应用。
(7)当数据关系复杂到难以用树形结构表示时,一般采用网络结构使数据对象连接起来。
网络数据集中的节点不受其他与之相连的有限节点的限制(层次节点则不同,它们只有一个父节点),且没有内在的等级结构,两个节点之间可以有多种联系,节点及节点间的关系可以有多个属性。拓扑结构包括无环、栅格、直接与间接连通、有原点、无原点等形式。用户在查看网络节点和连接等信息外,一般还会考虑节点之间最短路径或最小费用等问题。目前,网状数据可视化在 GIS 地理信息系统和互联网可视化等领域已经取得了一定进展,但由于数据结构比较复杂,因此网状数据可视化的技术还不完善。