SPSS软件的二项检验:基本原理
二项检验的基本功能是通过样本的频数分布来推断总体是否服从特定二项分布,它适用于对二分类变量的拟合优度检验。这种检验过程也是通过分析实际的频数与理论的频数之间的差别或者说吻合程度来完成的。
二项检验的零假设为:样本所属总体的与所指定的某个二项分布无显著差异。二项检验的检验统计量如下所示:
其中 n 1 表示第一个类别的样本个数, p 表示指定二项分布中第一个类别个体在总体中所占的比重。统计量在大样本条件下渐进服从于正态分布。如果该统计量小于临界值,则认为样本所属的总体的分布与所指定的某个二项分布无显著差异。
需要特别说明是,并不是所有的数据都适合二项检验过程,即便数据适合,也不是在所有情况下都适宜采用二项检验过程。
在SPSS官方网站的帮助文档《 IBM_SPSS_Statistics_Base 》中,对“二项检验”检验方法的应用条件进行了特别指导:数据方面,检验的变量应为数值二分变量,用户要将字符串变量转换为数值变量,需要使用“自动重新编码”过程(在“转换”菜单上提供)。二分变量是只能取两个可能值的变量:yes或no,true或false,0或1,等等。在数据集中遇到的第一个值定义第一个组,其他值定义第二个组。如果变量不是二分变量,那么必须指定分割点。分割点将具有小于或等于分割点的值的个案指派到第一个组,并将其余个案指派到第二个组。假设条件方面,二项检验这种非参数检验不要求假定基础分布的形状。数据均假定为随机样本。