卡方检验(Chi-Square Test),是K.Pearson给出的最常用的非参数检验方法之一,一种用途很广的计数资料的假设检验方法,属于非参数检验的范畴,其根本思想在于比较理论频数和实际频数的吻合程度或拟合优度问题。
与参数检验相比,卡方检验对数据的要求不高,精确度较低,然而它的局限性也是它的优势所在。卡方检验可接受的数据范围较广,因此能够应用在更广阔的研究环境中。
卡方检验的基本思路
卡方检验又分单样本卡方检验以及两个或多个样本的卡方检验。单样本卡方检验只涉及一个变量,但数据要分成不同的类别,旨在检验不同类别的实际频数与期望频数是否吻合,故又称适合度检验。实际频数是指在实验或调查中得到的计数数据,又称观察频数;期望频数或理论频数是根据某种概率原理或理论分布频数计算出来的。实际频数与期望频数差异越小,越不容易达到显著性水平,就越吻合。
要对两个或两个以上变量的计数资料进行分析,考查不同类变量之间是相互独立还是互有联系时,这类分析又叫独立性检验。如在一个英语学习者写作调查中(见表7-1),我们要比较两组写作文体的各个段落中是否有主题句,检验文体类型与主题句的关联情况,这时就要用到卡方的独立性检验。
表7-1中的52、19、39、3是表中的基本数据,因此,此表资料又被称为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数 O 和理论频数 E 差值平方与理论频数之比的累计和,可用公式表示为:
表中每个格子的理论频数 E 是在假定两组的主题句使用率相等(均等于两组合计的使用率)的情况下计算出来的,即行总计乘以列总计再除以样本容量,如第一行第一列的理论频数为71×91/113≈57.18。卡方值越大,说明实际频数与理论频数的差别越明显,两组主题句使用率不同的可能性越大,即文体类型与主题句使用的关联性越大。