Pearson乘积矩相关分析的基本思想
Pearson相关(Pearson correlation)分析又称Pearson乘积矩相关分析,其相关系数称为线性相关系数(linear correlation coefficient),简称相关系数(correlation coefficient),记为r,可评价两个连续变量(continuous variable)之间的线性关系(linear relationship)。
线性关系又称直线关系,是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。r介于-1~1之间,r的正负号表示两变量之间线性关系的方向,即r>0为正相关,r<0为负相关,r=0为零相关。
r的绝对值大小则表示两变量之间直线关系的密切程度,r越接近1或-1,说明两变量的直线关系越密切;r越接近0,直线关系越不密切。
值得注意的是,r的大小只表示两个变量间直线关系的密切关系,而当r接近0或等于0时,只说明两个变量间的直线相关性很差,但并不是说两个变量间不可能存在其他的相关性(如曲线相关等)。
线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料。如果资料不服从正态分布,则应先通过变量变换,使之正态化,再根据变换值计算相关系数。