数据可视化的设计要素
形状和颜色构成了数据可视化的基本手段,将数据信息表示成图形元素和颜色的过程称为数据的可视化编码。数据信息与“形”“色”之间匹配的好坏是个技术问题,也是个应用问题,还兼有艺术问题。
数据能够表示的信息无外乎3类,即分类、定序、定量。有时也将定序和定量统称为定量,这样数据就分成定性和定量两大类了。
图形的表现形式非常丰富,如点、线、面,或者一维、二维、三维,或者静态、动态,或者形状、尺寸、方向、密度、纹理等。
颜色的表现形式也很丰富,如色调、饱和度、亮度,或者色彩的感情倾向(如冷暖色调、悲喜色调)等。
一般而言,形状、颜色的色调、空间位置通常用来表示定性的信息,直线长度、区域面积、空间体积、斜度、角度、颜色的饱和度及亮度等可以表示定量的信息。
定量数据是要比较数值大小关系的,因此定量数据的可视化表示必须考虑精确度问题。在这么多的定量可视化要素中,哪个更能反映数据的精确度呢?
1985年,AT&T贝尔实验室的统计学家威廉·克利夫兰(William Cleveland)和罗伯特·麦吉尔(Robert McGill)发表了关于图形感知方法的论文,给出了数据精确度表示形式排序图,如图5-7所示。
图5-7 数据精确度表示形式排序图
不仅数据的精确度表示形式不同,对分类、定序、定量3类数据使用各种可视化元素的优先级也是不同的。由于“形”“色”的可视化元素众多,只能给出一个总体的参考建议,这就是针对不同数据类型的可视化元素选用排序。