Stata的简单相关分析又称双变量相关分析,通过计算皮尔逊简单相关系数、斯皮尔曼等级相关系数、肯德尔等级相关系数及其显著性水平展开。其中皮尔逊简单相关系数是一种线性关联度量,适用于变量为定量连续变量且服从正态分布、相关关系为线性时的情形。如果变量不是正态分布的,或具有已排序的类别,相互之间的相关关系不是线性的,则更适合采用斯皮尔曼等级相关系数和肯德尔等级相关系数。
斯皮尔曼等级相关系数用来考察两个变量中至少有一个为定序变量时的相关系数,比如性别与月消费金额之间的关系。计算公式为:
d i 表示 y i 的等级和 x i 的等级之差, n 为样本容量。
斯皮尔曼等级相关系数的显著性也可以被检验,小样本情况下对应的统计量公式为:
大样本情况下对应的统计量公式为:
r 表示斯皮尔曼等级相关系数值, n 表示样本观测个数。