虽然简单随机抽样是概率抽样的最基本方法,但它也存在很多局限,比如简单随机抽样需要将总体全部进行编号,当总体体量大时会增加工作量。而且市场调查的样本量一般至少为几百个,即使总体编号不是问题,但用抽签法或随机数字表法抽取费时费力。更重要的是简单随机抽样常常忽略总体已有的信息,从而降低样本代表性。因此,人们在简单随机抽样的基础上改进出了系统随机抽样。
系统随机抽样(systematic random sampling)也叫等距抽样或机械抽样,是与简单随机抽样类似的一种等概论抽样方法。
它要求将总体的每个个体编号,并按照一定顺序排列,然后按一定间隔选取样本。在市场调查实践中,系统抽样常被作为简单随机抽样的代替法使用,如使用得当,其结果基本与简单随机抽样一致。和简单随机抽样相比,系统随机抽样实施更为便捷,费用更低,成为一种常用的抽样方法。
系统随机抽样的具体步骤如下:
1.和简单随机抽样一样,使用系统抽样也需要对总体中的每个个体进行编号,且需将个体按一定顺序排列(完成抽样框)
2.利用公式计算抽样间距。决定抽样间距的公式为:
样本间距(K)=总体规模(N)/样本规模(n)
3.在总体中选择任意编号作为起点,根据样本间距(K)连续抽取符合要求的编号入样,直至达到样本量要求
以下是一次使用系统随机抽样的过程:
为了解受众对节目编排的意见,东方卫视计划从205户居民中抽取8户作为代表进行调查,如果选用系统随机抽样方法进行选取,其过程如下:
1.将205户居民从001到205编号
2.用公式决定间隔数(K=205/8≈26,四舍五入)
3.抽取第一个编号:可以随意选择起点,可以利用随机表选出,也可以主观决定起点
4.按K的值进行等距抽取
想一想,在这个案例中可能会出现什么情况?
情况一:选中的样本恰好在总体编号范围内
17、43、69、95、121、147、173、199
情况二:起始编码很大,导致按间隔抽选时,会出现超出编号的可能
137、163、189、215、241、267、293、319
第一种情况直接符合我们的要求,而当出现第二种情况时(编码超出了总体规模),则应把超出部分分别减去N,然后入样:
137、163、189、215(10)、241(36)、267(62)、293(88)、319(114)
根据这两种抽样状况,想一想当我们在实际抽样时,如果选用了系统随机抽样方法,如何操作会更便利一些?
调研人员往往会因为系统随机抽样的经济性、操作便捷性,以及时间和费用成本都相对较少而选用它。在使用过程中要注意避免样本框中的固有周期性分布与样本间距重合。比如央视索福瑞计划采用系统随机抽样的方法对湖南卫视全年收视情况进行调查,他们打算从湖南卫视全年365天中抽取一定量天数的收视率进行观察,如果他们计算出的间距为7,则抽取的结果将无法代表总体的全部情况,从而导致结论存在严重偏差。想一想为什么?