数据的可视化主要是借助于图形化手段,清晰有效地传达与沟通信息。为了有效地传达思想、概念,需要美学与功能齐头并举,直观传达关键特征,从而实现对于相当稀疏而又复杂数据集的深入洞见。因此,数据可视化的核心是对原始数据采用什么样的可视化元素来表达。
图5.1所示是利用可视化工具呈现的某物流云平台大数据可视化用户界面,其中利用多种图表形式呈现了物流数据的分布情况。
图 5.1 物流云平台大数据可视化用户界面
在大数据可视化分析中,空间大数据的可视化呈现形式更是多种多样:
有相对量化的,也有抽象的;有离散的,也有连续的。不同的呈现形式所要表达的含义也不尽相同,主要呈现方式有海量散点、分组散点、气泡、热力、立体热力、网格,以及立体柱状、道路密度分级渲染、道路热力渲染、静态线、飞线、动态网格密度、蜂窝网格密度等方式。
海量散点图:
散点图是一种离散点在空间中的表达形式,通过海量散点的全量展示,能够让人们体会到每一个动作(如开关锁、上下车)在特定位置的特殊含义。
分组散点图:
分组散点是一类特殊的散点形式,主要是通过对类别进行不同颜色的区分,以表达不同的含义,让用户获取更加明确的信息。例如,将共享单车开锁点、关锁点设置为不同颜色,观察不同时间段(如上下班高峰期),开锁与关锁两个点的分布是否有完全不同的规律。
气泡图:
气泡图是散点的一种特殊形式,通过不同的权重表达散点的大小,同时也可以关联不同的颜色,形成一个个不同大小、不同颜色的点。相比普通散点和分组散点、气泡图所表达的数据维度较多,展现效果也更加华丽多彩。
热力图:
热力图是一种常见的空间表达方式,主要是通过离散的数据分布(可能还带有权重),在不同的层级在同一屏幕区域的聚合表达,如离散的手机GPS位置请求,可以把每次请求当作一个独立个体,通过热力展示得到某一些区域人员分布情况。如果密度大,在热力图上展示这块区域就比较热,可以用比较偏热的颜色表达这种信息,如红色、紫色等。
立体热力:
立体热力与热力的概念基本一致,只是在不同技术上的表达方式不一致。普通热力主要是二维地图的表达,立体热力主要是支持WebGL展示平台上的一种展示形式,如Mapbox或者其他三维可视化平台。
网格图:
网格图是一种经过空间统计分析后的表达形式,通过定义规则的网格,如矩形网格、蜂窝网格,然后统计每个网格内的散点数量,最后根据网格的分级标准,如不同的值区间,进行不同颜色的分段表达。其实网格图类似于热力图,不过网格图在视觉上规则感较强。