Stata的简单相关分析又称双变量相关分析,通过计算皮尔逊简单相关系数、斯皮尔曼等级相关系数、肯德尔等级相关系数及其显著性水平展开。其中皮尔逊简单相关系数是一种线性关联度量,适用于变量为定量连续变量且服从正态分布、相关关系为线性时的情形。如果变量不是正态分布的,或具有已排序的类别,相互之间的相关关系不是线性的,则更适合采用斯皮尔曼等级相关系数和肯德尔等级相关系数。
其中常用的皮尔逊相关系数公式为:
相关系数 r有如下性质:
1)-1≤ r ≤1, r 的绝对值越大,表明两个变量之间的相关程度越强。
2)0< r ≤1,表明两个变量之间存在正相关。若 r =1,则表明变量间存在着完全正相关的关系。
3)-1≤r<0,表明两个变量之间存在负相关。r=-1表明变量间存在着完全负相关的关系。
4) r =0,表明两个变量之间无线性相关。
在Stata中,我们可以检验皮尔逊简单相关系数是否显著。系数对应的统计量公式为:
r 表示皮尔逊简单相关系数值, n 表示样本观测个数。
皮尔逊简单相关系数所反映的并不是任何一种确定关系,而仅仅是线性关系,而且也不是因果关系,换言之,随机变量 X 、 Y 的地位是相互的、相同的。
此外,协方差也可以用来判断变量间的简单线性相关关系,协方差计算公式为: