机械抽样按样本单位抽选的方法不同分类
(1)随机起点等距抽样。
当抽取间隔k确定以后,在第一组随机抽选一个样本单位,设该样本单位的顺序号为a,则第二个样本单位的顺序号为k+a,第三个样本单位的顺序号就为2k+a,其余类推,第n个样本单位的顺序号为(n-1)k+a。
当总体按无关标志排队时,随机起点等距抽样是可以应用的。当总体按有关标志排队时,随机起点等距抽样会产生系统性误差。
(2)半距起点等距抽样。
要求各样本单位都选在各组的中点。各样本单位的顺序号是:第一个样本单位是k /2,第二个样本单位是k+k /2,第三个样本单位是 2k+k /2,…,第n个样本单位是(n-1)k+k /2。
无论按有关标志排队和按无关标志排队都可以采用这种方法。这种方法的优点是简单易懂、易于实践。当总体按有关标志排队时,采用这种方法保证样本有充分的代表性,长期以来在大规模社会经济调查中被广泛运用,实际检验效果也是令人满意的。
但半距起点等距抽样也存在一定的局限性。首先,随机性不明显,当总体排队确定,样本容量确定,则样本单位也随之确定了。其次,只能抽取一个样本,不能进行样本轮换,抽样的利用率太低。
(3)对称等距抽样。
要求在第一组随机抽取第一个样本单位,假设该单位的顺序号为a,在第二组与第一个样本单位对称的位置抽取第二个样本单位,它的顺序号为 2k-a。在第三组与第二组样本单位对称的位置抽取第三个样本单位,它的顺序号为 2k+a。以后抽出的样本单位序号依次为(4k-a),(4k+a),(6k-a),(6k+a),…。
对称等距抽样保留了半距起点等距抽样的优点,又避免了它的局限性,使其优点更加明显。
机械抽样的概念和作用
机械抽样又称等距抽样或系统抽样,它是对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些抽取的单位组成样本进行观察的一种抽样方法。
设总体有N个单位,现需抽取一个容量为n的样本,其抽选方法是先将N个总体单位按一定顺序进行排列,令k =N/ n,k称为抽样间隔或抽样距离,这样实际上把总体单位分成n段,每段中有k个单位,然后在 1-k中随机地抽取一个随机数,设为i,则第n个单位为抽中单位,以后每隔k个单位为一抽中单位,即第i+k,i+2k,…,i+(n-1)k,直到抽满n个单位为止。
机械抽样的特点是:
1.简便易行
就简单的随机抽样来说,在抽样之前须对每个单位加以编号,然后才利用ongoing随机数码表等方法抽选样本,当总体单位很多时,编号与抽选也比较麻烦。而等距抽样只要确定了抽样的间隔和起点,整个样本的所有单位也随之自然确定。它可以利用现成的各种排列,如某市的工业企业可以按照有关系统和部门的习惯顺序排列,抽样时就可以直接利用这些顺序进行等距抽样。这种抽样方法也便于推广,为不熟悉抽样调查的人员所掌握,也适合某些基层现场的抽样调查。例如,在森林调查中,常常很难在林地中划分抽样单位,然后随机抽选,而机械抽样就比较方便。
2.误差大小与总体单位顺序有关
因此,当对总体的结构有一定了解时,可用已有的信息对总体进行排列后采用机械抽样,就能提高抽样效率。一般情况下,等距抽样使本单位在总体中散布比较均匀,其抽样平均误差要小于简单随机抽样。因此,这是大规模抽样调查中一种比较常用的抽样方法。