相关分析的主要内容包括两个方面:
一是判断现象之间是否存在相关关系;
二是判断现象之间相关关系的形态和相关程度。
判断的方法主要有定性分析、相关表、相关图和相关系数。
1.定性分析
定性分析是指依靠分析者的理论知识、经验和分析判断能力来判断变量之间是否存在真实的相关关系的方法。有时会存在这样的情况,对两列数据绘制一个散点图,散点图会显示出明显的线性或非线性形态;或者计算相关系数,相关系数的值很大,但实际上变量之间没有任何关系,这种关系属于伪相关,不是真正的相关。对伪相关变量进行相关和回归分析,将使分析变成毫无意义的数字游戏。利用定性分析,可以在定量分析之前排除伪相关,避免对伪相关现象的进一步分析,避免轻率地得出一些因果关系结论。
2.相关表
相关表是显示变量之间相关关系的统计表。研究变量之间数量上的相互依存关系时,首先需要取得相关变量成对的资料,并将两个变量的对应值平行排列,其中某一变量按其取值大小顺序排列,形成相关表。根据表中的数据,分析人员可以分析城镇居民人均可支配收入和城镇居民恩格尔系数之间的关系、农村居民人均纯收入和农村居民恩格尔系数之间的关系。相关表中的数据通常是反映变量之间关系的部分数据,即样本数据。样本数据应有足够的代表性,数据不宜过少。相关表是绘制相关图、计算相关系数的依据。
3.相关图
相关图也称散点图,是由相关变量对应数值在坐标系中绘出的散点形成的二维图。在坐标系中,若横轴代表变量x,纵轴代表变量y,则每组数据(xi,yi)形成坐标系中的一个点,n组数据形成n个点,称为散点。n个散点所呈现出来的形态为我们判断变量之间的关系提供了依据。散点图是描述变量之间关系的一种较为直观的方法,从中可以直观地看出变量之间的关系形态和关系强弱程度。图9-1所示为一组不同类型的散点图。
4.相关系数
相关系数是说明两个变量之间在线性相关条件下相关程度的统计分析指标,用r表示,它的取值范围是0≤|r|≤1。
① 当r>0时,x与y正相关。
② 当r<0时,x与y负相关。
③ 当r=0时,x与y之间不存在线性相关关系。
④ 当|r|=1时,x与y完全相关。其中,r=1,表示x与y完全正线性相关;r=-1,表示x与y完全负线性相关。
在判断变量之间的相关程度时,可参照如下标准。
① 0<| r|<0.3,x与y呈弱线性相关;
② 0.3≤| r|<0.5,x与y呈低度线性相关;
③ 0.5≤| r|<0.8,x与y呈显著线性相关;
④ 0.8≤| r|<1,x与y呈高度线性相关。
应用积差法计算相关系数的公式为
[图片]
式中,σ2xy为xy的协方差,σx为变量x的标准差,σy为变量y的标准差,n为变量x和y的个数,x为变量x的实际观察值,y为变量y的实际观察值。
