SPSS多个独立样本的检验:基本原理
在实际工作中我们常常需要比较多个独立样本是否来自与具有相同分布总体的样本。而当这些样本都是来自于同方差的正态总体时,可以使用方差分析过程进行检验,如果正态的假定不满足时,便可以使用多个独立样本的检验过程来进行检验。
多独立样本检验用于在总体分布未知的情况下判断多个独立的样本是否来自相同分布的总体。
SPSS 25.0版本提供了Kruskal-Wallis H方法(克鲁斯卡尔-沃利斯检验)、Jonckheere-Terpstra检验法(约克海尔-塔帕斯特拉检验)和推广的中位数检验法(中位数检验)三种方法进行多独立样本检验。
在SPSS官方网站的帮助文档《 IBM_SPSS_Statistics_Base 》中,对这几种检验方法都进行了权威解释。
1.Kruskal-Wallis H检验
Kruskal-Wallis H检验又称克鲁斯卡尔-沃利斯检验,该检验方法从基本思想上来说,是Mann-Whitney U检验法的扩展,是一种推广的评价值检验。其基本思路是,首先对所有样本合并并按升序排列得出每个数据的秩,然后对这各组样本求平均秩。如果通过计算后得到的平均秩相差很大,则可以有足够的理由认为两组样本所属的总体有显著差异。
2.Jonckheere-Terpstra检验法
Jonckheere-Terpstra检验法,也就是约克海尔-塔帕斯特拉检验,该检验方法在总体具有先验的排序的前提下具有较高的检验效率,其检验思路与两独立样本下的Mann-Whitney U检验法相似,计算某组样本的每个秩优于其他组样本的每个秩的个数。如果通过计算后得到的这些数据差距过大,则认为两组样本所属的总体有显著差异。
3.推广的中位数检验法
推广的中位数检验法,在SPSS软件中标记为中位数检验,该检验方法的基本思路和核心理念是,首先将参与分析的所有样本合并并计算中位数,然后计算各组样本中大于或小于这个中位数的样本的个数。如果通过计算后得到的这些数据差距过大,则认为两组样本所属的总体有显著差异。
关于Kruskal-Wallis H方法(克鲁斯卡尔-沃利斯检验)、Jonckheere-Terpstra检验法(约克海尔-塔帕斯特拉检验)和推广的中位数检验法(中位数检验)等检验方法的更加具体的理论阐述可以参考数理统计或者非参数统计的教材和专著。
多个独立样本的检验过程需使用经过排序的数据,检验过程使用的样本必须是相互独立的随机样本。在使用Kruskal-Wallis H(克鲁斯卡尔-沃利斯检验)检验时,还要求被检验的样本形状相似。