堆积柱状图的两种画法与注意事项
堆积柱状图和柱状图的本质一样,都是在展示频数。只不过简单的柱状图只涉及一个离散型变量(比如性别),而堆积柱状图涉及两个离散型变量(比如性别和职称)。
图2-14展示了一组样本数据中,性别和职称交叉频数的柱状图。
图2-14 一组堆积柱状图示例
因为有两个离散型变量,柱子可以代表任何一个变量,这样就产生了两种画法。左上角的柱状图中,柱子代表职称;右上角的柱状图中,柱子代表性别。也正是因为柱子只能代表一个变量的不同类别,那么另外一个变量的类别只能通过颜色(也有其他手段,颜色最为常见)进行区分。这样就需要一个额外的标签,标注另一个变量的不同类别所对应的颜色。按照交叉频数的展示手段,是“堆积展示”(左上角)还是“分开展示”(左下角),又会形成两种不同的画法。
于是,同一组数据,可以有四种不同的展示方法。具体采用哪个柱状图,取决于想给读者传递的信息。比如右上角的柱状图,比起其他三个,能够更直观地传递男性总数多于女性这一信息。
有两点值得注意:
(1)堆积柱状图也可以展示一个离散型变量和一个连续型变量,甚至两个连续型变量,前提是将连续型变量离散化,比如将年龄分成若干离散区间。
(2)采用堆积展示的手段,不太适合在柱子上标注出交叉频数,会显得混乱。