(2)不等概率系统抽样。
不等概率系统抽样(PPS 系统抽样)是指每个单位被抽中的概率与该单位的规模成比例的抽样方法。如果总体单位的大小差异较大,则可采用不等概率系统抽样方法。其基本思想是:令总体中第 i个单位的入样概率与该单位的大小成比例。在具体实施过程中,可以按照类似等距抽样的方法进行:
用一个辅助变量使总体单位按大小顺序排列;对总体单位的辅助变量值进行累计,累计总量为M;确定抽样间距k,k=M/n;随机确定一个小于或等于k的实数r为抽样的起点,那么r、r+k、r+2k、r+3k等对应的单位就是被抽中的入样单位。
【例5-2】采用PPS系统抽样方法从12种晚报中随机抽取4种进行内容分析。12种晚报的发行量分别为20万份、67万份、45万份、120万份、39万份、85万份、58万份、98万份、76万份、210万份、25万份和150万份。
解析
已知N= 12,n= 4,由于12种晚报的发行量差异较大,因此采用等概率系统抽样或简单随机抽样方法抽取4种报纸是不可取的。考虑发行量这个因素,应采用PPS系统抽样方法进行抽取。数据如表5-1所示。
① 以发行量为依据依次列出12种报纸的发行量,并计算累计发行量,M = 993万份。
② 确定抽样间距:[图片](万份)。
③ 确定抽样的起点r:随机地选定r= 146。
④ r=146、r+k=394、r+2 k=642、r+3 k=890这4个累计发行量对应的4种报纸就是入样报纸,分别是编号为5、8、11、12的报纸。
