举例说明什么是数据关系的可视化?

2023年7月7日11:00:22举例说明什么是数据关系的可视化?已关闭评论

在大数据时代,人们不仅要处理海量的数据,同时还要对这些数据进行加工、传播、分析和分享。目前,实现这些形式比较好的方法就是大数据可视化。数据可视化是关于数据视觉表现的形式,如柱状图、饼状图、直方图、散点图、折线图等最基本的统计图表。由于这些原始统计图表只能呈现数据的基本统计信息,当面对复杂或大规模结构化、半结构化和非结构化数据时,大数据可视化的设计与编码就复杂得多了。因此,大数据可视化可以理解为数据量更加庞大、结构更加复杂的数据可视化。大数据的可视化侧重发现数据中蕴含的规律特征、洞察数据价值,呈现形式也多种多样。

大数据可视化呈现形式:数据关系的可视化

数据关系也是数据可视化要表达的主题之一。

例如,学术期刊之间存在千丝万缕的联系,比如文章的相互引用。期刊A的文章往往倾向于引用期刊B的文章,而期刊B则对A的文章表示不屑,转而引用C的文章比较多。

例如,通过Web of Knowledge平台就可以查看学术期刊间的关系,如图5.3所示。

从该图可以看到期刊关系的可视化结果,色块面积表示引用量。另外,在工具窗口的上方有个可以下拉的选项框,用以选择被引或引用的关系。

举例说明什么是数据关系的可视化?

图5.3 学术期刊相互引用关系的聚类可视化

实施大数据可视化需要考虑的问题

尽管大数据可视化展示方式多种多样,但当采用一项新技术时,需要采取一些有效方法。除了扎实地掌握数据外,还需要理解可视化目标、需求和受众。在机构准备实施数据可视化时,一般要考虑以下几方面的问题:

▶明确试图可视化的数据,包括数据量和基数(一列数据中不同值的个数);

▶确定需要可视化和传达的信息种类,如事务明细、累积聚合、比值比例等;

▶了解数据的受众,并领会他们如何处理可视化信息;

▶使用一种对受众来说最优、最简的可视化方案传达信息。

在明确数据属性、作为信息消费者的受众等相关问题后,就需要准备与大量数据打交道了。大数据给可视化带来新的挑战,4V(Volume、Velocity、Variety、Value)是必须要考虑的问题,而且数据产生的速度经常会比其被管理和分析的速度快。需要可视化的列的基数也是应该考虑的重要因素,高基数意味着该列有大量不同值(如身份证号),而低基数则说明该列有大量重复值(如性别)。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。