在很多时候,进行相关分析变量的取值会同时受到其他变量的影响,这时候就需要把其他变量控制住,然后输出控制其他变量影响后的相关系数。比如在分析学生各科学习成绩之间的相关性时,各科学习成绩同受IQ值的影响等。Stata的偏相关分析将计算偏相关系数,该系数在控制一个或多个其他量效应的同时,分析两个变量之间的线性相关关系。
偏相关分析也称净相关分析,它是在控制其他变量的线性影响下分析两个变量间的线性相关,所采用的工具是偏相关系数。假如有个控制变量,则称为阶偏相关。一般情况下,假设有 n ( n >2)个变量 X 1 , X 2 ,…, X n ,则任意两个变量 X i 和 X j 的 g 阶样本偏相关系数公式为:
式中右边均为 g -1阶的偏相关系数,其中 l 1 , l 2 ,…, l g 为自然数从1到 n 除去 i 和 j 的不同组合。
偏相关分析的命令是pcorr,该命令的语法格式为:
pcorr varname varlist [if] [in] [weight]
pcorr为命令,varname为指定变量,varlist为变量列表,假设varlist变量列表中有n个变量,偏相关分析将输出指定变量varname与varlist变量列表中所有变量的偏相关系数,共n个(输出指定变量varname与varlist变量列表中某一变量的偏相关系数时,将会把其他 n -1个变量同时作为控制变量)。[if] 为条件表达式,[in]用于设置样本范围,[weight]用于设置权重。