两独立样本Pearson χ2检验的基本思想
Pearson χ2检验是在原假设下对资料的观测分布(observed distribution)和期望分布(expected distribution)进行比较,主要用于检验两个或多个分类变量(性别或职业等)总体率(或构成比)是否有差异或两个变量之间是否关联,可用于R×C表(含四格表)。
χ2检验要求理论频数不宜太小,否则将导致分析的偏性,四格表要求每个格子的期望频数E≥5,且总例数n≥40,而R×C表不宜有1/5以上格子的E<5,或者有任意一个格子的E<1。