每年国家统计局和各省市统计局都会发布“平均工资”的统计数据,媒体报道平均工资时常常使用“你拖后腿了吗?”“你被平均了吗?”之类的标题,很容易引起群众的热议。仅仅将自己的工资和平均工资作对比,就能知道自己有没有“拖后腿”吗?
表1-1是三组月薪调查数据,三组数据的平均值都是10 000元,于是我们告知被调查人员,平均月薪是10 000元,想想看,三组人员会有怎样的反应?第一组的大多数人会欣然接受这个结果,第二组是有人欢喜有人愁,第三组的大多数人会即刻加入“吐槽水军”,高呼自己“被平均了”。可见,均值相同并不意味着一切都相同,均值不是统计数据的唯一特征,标准差、最大(小)值、中位数等都是数据的特征,它们的作用是均值无法替代的。
表1-1 三组月薪调查数据 单位:元
表1-2是三组数据的统计特征汇总表,从表1-2中可以看到,三组数据只有均值是相同的,其他统计特征各不相同,对比三组数据的统计特征可以得到新的认知。比如,第一组和第二组的标准差相比均值都较小,而第三组数据的标准差达到了24 640元,是均值的近2.5倍,这说明第三组数据分布得极其分散,从最大值、最小值的对比也可以得到相似的推断。又如,第三组数据的中位数和四分位数都在2 000元、3 000元附近徘徊,相比均值小很多,这说明有少数很大的数据将均值拉升到10 000元,反观第一组和第二组数据,就没有这种现象。
均值的确是数据的重要统计特征,但同时它只是一个统计特征,只有掌握了标准差、最大(小)值、中位数等多个统计特征,才能既全面又准确地解读出数据的内涵。
表1-2 三组月薪数据的统计特征 单位:元