SPSS软件的偏相关分析:基本原理
相关分析通过计算两个变量之间的相关系数分析变量间线性相关的程度。在多元相关分析中,由于受到其他变量的影响,两变量相关系数只是从表面上反映了两个变量的性质,往往不能真实地反映变量间的线性相关程度,甚至会给人们造成相关的假象,因此在某些场合中,简单的两变量相关系数并不是刻画相关关系的本质性统计量。当其他变量被固定,即将它们控制起来以后,给定的任意两个变量之间的相关系数称为偏相关系数。偏相关系数也称净相关分析,它是在控制其他变量的线性影响下分析两变量间的线性相关程度,所采用的工具是偏相关系数。
例如在研究身高、体重、肺活量三者的相关关系时,显然肺活量与身高、肺活量与体重均存在一定的正相关关系,但是当我们将体重固定下来,对相同体重的人分析肺活量与身高的关系时,是否仍然具有身高越高,肺活量越大的正相关关系呢?恐怕就不一定了。偏相关分析用于计算变量间的偏相关系数,以利于更准确地判断变量之间的相关关系和相关程度。
从公式来讲,假如有一个 g 控制变量,就称为 g 阶偏相关。假设有 n ( n >2)个变量 X 1 , X 2 , …, X k ,则任意两个变量 X i 和 X j 的 g 阶样本偏相关系数公式为:
式中右侧均为 g -1阶的偏相关系数,其中 l 1 , l 2 , …, l g 为自然数从1~k除了 i 和 j 的不同组合。
本节中,我们主要研究一阶偏相关。若分析变量 X 1 和 X 2 之间的净相关时,控制 X 3 的线性关系,则 X 1 和 X 2 之间的一阶偏相关系数为:
假设检验过程如下:
(1)提出原假设和备择假设。
(2)构造并计算统计量。偏相关用到的统计量为t统计量,其数学定义公式为:
式中, r 为偏相关系数, n 为样本数, g 为阶数。
(3)选取恰当的显著性水平,作出统计决策。
SPSS自动计算后给出 p 值,若 p 值小于显著性水平,则拒绝原假设,即认为两个变量之间的偏相关关系显著;否则,接受原假设,即认为两个变量之间的偏相关系数与零无显著差异。