SPSS软件的卡方检验:基本原理

2022年5月26日16:03:42SPSS软件的卡方检验:基本原理已关闭评论

SPSS软件的卡方检验:基本原理

卡方检验是一种根据样本数据来推断总体分布与期望分布或某一理论分布是否存在显著差异的检验,通常适于对有多项分类值的总体分布的分析,是一种吻合性检验。卡方检验过程可将一个变量以表格形式列在不同的类别中,并计算卡方统计。卡方拟合优度检验比较每个类别中的观察的和期望的频率,以检验所有类别是否包含相同比例的值,或检验每个类别是否包含用户指定比例的值。举一个非常通俗易懂的例子,卡方检验可用于确定一盒玻璃球是否包含相等比例的红色、蓝色、黑色、绿色、黄色和白色玻璃球,也可以检验一盒玻璃球是否包含10%红色、20%蓝色、30%黑色、10%绿色、5%黄色和25%白色玻璃球。

卡方检验的原假设为:样本所属的总体的分布与期望分布或者某一理论分布无显著差异。卡方检验的检验统计量如公式所示:

SPSS软件的卡方检验:基本原理

其中 oi 表示观测频数, ei 表示理论频数。 值越小,表示观测频数与理论频数越接近,该 统计量在大样本条件下渐进服从于自由度为k-1的卡方分布。如果该 统计量小于由显著性水平和自由度确定的临界值,则认为样本所属的总体的分布与理论分布无显著差异。

需要特别说明和强调的是,并不是所有的数据都适合卡方检验过程,即便数据适合,也不是在所有情况下都适宜采用卡方检验过程。

在SPSS官方网站的帮助文档《 IBM_SPSS_Statistics_Base 》中,对“卡方检验”检验方法的应用条件进行了特别指导:数据方面,用户需要使用排序的或未排序的数值分类变量(有序或名义测量级别),要将字符串变量转换为数值变量,需要使用“自动重新编码”过程(在“转换”菜单上提供)。在假设条件方面,非参数检验不要求假定基础分布的形状,数据均假定为随机样本,每个类别的期望频率应至少为1,应有不超过20%的类别具有小于5的期望频率。

  • A+
所属分类:Spss
  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。