卡方检验是一种非参数检验。
尽管它所依赖的假设是变量总体正态分布,但它不需要样本数据严格按正态分布。虽然卡方检验的条件宽松,但也有很多需要注意的条件:
(1)样本必须是随机抽取的。
(2)数据必须以原始次数报告,不能是百分比。
(3)测量变量必须是独立的。
(4)自变量和因变量的值或分类必须是相互独立的。
(5)观察次数不能太小。
此外,不同的检验方法,具体的使用条件也不同。
例如:四格表资料的卡方检验用于进行两个变量构成比的比较,要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时,卡方数值需要校正;当样本含量小于40时,则只能用确切概率法计算概率。
行列表资料卡方检验要求每个格子中的理论频数 T 均大于5或1< T <5的格子数不超过总格子数的1 / 5。当 T <1或1< T <5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行列表资料卡方检验的应用条件。