随机区组设计:什么意思、例子案例、适用情况
完全随机设计基于这样一个假设而成立,即所有参加实验的小组之间对于自变量变化的反应(敏感)程度和实验前被测数值(因变量的基数)是基本一致的。但是,这个假设常常是无效的。
比如,下面两种情况:
例一,一项实验要确定某商品使用三种价格水平中的哪一种最好,共有27个商店可以作为现场实验的观测单位。这些商店的销售水平为每月30万元到80万元不等。这种商品在每个商店的销售状况,基本上与所在商店总的销售状况相一致。如果采用完全随机设计,因为这种商品在每个商店的销售更多地受各商店销售规模的影响,再加之实验所用样本太小(27个商店),实验单位之间在销售规模上差异又很大,所以我们可能看不出价格对商品销售的影响。因为按照随机原则很难选到规模相同的商店,所以完全随机设计不适用。
例二,一项实验要确定一种新型饮料的不同广告设计中何者为优的问题。广告设计的主题有三个,一是突出男性,二是突出女性,三是突出中性。根据突出男性的程度和突出女性的程度,实验者由男到女设计了六种突出男女性程度不同的广告。因为被试性别会影响他们对广告的反应,所以当性别对实验结果的影响程度无法计算时,这项实验就不能使用完全随机设计。若勉强使用,则实验结果可能只是反映样本的性别构成。
如果研究者认为有一主要的外生变量,如被试的销售水平(例一)或性别(例二)会严重影响实验结果,则可以采用随机区组设计(randomized block design)。不过,在使用这种设计之前,研究者必须能够确定或测定这个外生变量。应用这种设计,首先要根据外生变量把实验单位划成区组,各区组内各单位从外生变量的角度看应尽量相同,以保证它们对外生变量的反应基本一样。然后,根据随机原则从各区域选择实验单位组成实验小组,进行实验。最后,应用统计分析技巧就可以确定自变量对因变量的影响程度。
下面,我们应用例一来说明随机区组设计的程序。首先,用实验单位的数目27除以实验小组的数目3,得需要设置的区组数目为9。
区组设置结果与序号如表3-4第一列所示。
表3-4 随机区组设计表
然后,按照月销售额给商店排序,并把它们依次放入各区组中,如表3-4第二列所示。最后,随机地从每一个区组选择一个单位分配到各实验组中,如表3-4后三列所示。其中, X 1 、 X 2 、 X 3 分别表示采用第一、二、三种价格的实验组。
因为大部分实验都程度不同地受到商店类型和规模、被试的性别、收入或社会地位等外生变量的影响,所以随机区组设计比完全随机设计用途更广。它的主要缺陷是只能够控制一个外生变量。如果有多个外生变量严重影响因变量的变化,它就无能为力了。这时,可以使用拉丁方格设计或因子设计。