一次大规模抽样调查欲想取得预期效果,必须经过周密准备、科学设计和规范实施才能实现。进行抽样调查首先必须明确调查目的,规定调查内容,确定调查对象,只有这样才能编制一个高质量的抽样框,为抽样的实施提供良好的前提。当然在这一阶段还需进行调查人员培训,落实调查经费,开展试调查以为正式调查提供经验,发现并处理抽样方案设计中需改进之处,使日后大规模进行的抽样调查能科学、严格地实施。
一次抽样调查实施效果如何,关键取决于抽样调查设计。抽样调查设计的核心部分包括以下三个方面。
1. 抽样方案设计
这一部分主要包括两个问题,一个是抽样方法的选择和组合,即决定如何进行抽样的问题;另一个是样本容量的确定,即在选定的抽样方法下抽多少样本单元的问题。抽样方法的选择和组合应考虑到尽可能使抽样方便,易于实施,同时还必须考虑到应使样本有较好的代表性,有利于依此样本所进行的估计有较高的精度。样本容量的确定则与精度和费用两个因素有关。在一定的抽样方法下,欲想提高估计精度必须扩大样本量,欲想节省调查费用必须压缩样本量,两者对样本量的要求是矛盾的。因此不存在使精度最高且使费用最省的抽样设计。在实际问题中只能采用如下的原则确定样本量:
(1)使估计量达到规定的精度要求,确定使费用最省的样本量;
(2)在调查费用固定的约束下,确定使估计精度最高的样本量。
以上原则称为最优设计原则。
2. 调查方法确定
按已设计好的抽样方案抽得样本单元后,接下来需进行的工作即是调查,从调查单元收集所需的调查项目的数据。如何保证调查数据完整、真实、可靠,使源头数据不存在调查误差,是这一部分的关键问题。调查方法多种多样,可以采用问卷调查,也可以采用座谈会调查、电话调查、面访调查,问卷可以当面发放、回收,也可以通过邮寄、上网发放回收。问卷设计格式灵活多样,提哪些问题,采用什么方式提,各问题排列顺序如何,均应视调查对象的特点进行恰当的设计,以有利于被调查者更好地配合,提高回收率,减少无回答率。
3. 估计量的构造
取得调查数据后,下一步的工作就是如何使用这些数据,即根据调查目的对目标量给出尽可能精确、可靠的估计。这里首先应解决的问题是建立由所得数据能够给出目标量估计值的估计方法,也就是构造估计量的问题。
估计量把样本中反映总体参数特征的信息集中在一起,提供了由样本数据给出总体参数估计值的方法。从信息使用角度而言,一个好的估计量应该是包含待估参数尽可能多的信息从而精度比较高的估计量,所以在构造估计量时除了必须使用调查指标的样本信息即基本信息外,还应考虑是否存在可供利用的辅助信息,若存在可供利用的辅助信息,而且获得这些信息不需很多投入,那么综合使用了基本信息和辅助信息的估计量就比只使用单一的基本信息的估计量含有更多的有用信息,从而有利于提高估计量的精度。
其次,应使估计量具有较好的概率性质,例如无偏性、方差小。这就必须研究所构造的估计量是否具有无偏性,并从理论上给出其方差计算公式,方差越小的估计量精度越高。
第三,虽然估计量方差计算公式可以在理论上对其精度进行分析,但对一次具体的抽样调查而言不能计算出方差的真值,因为要计算方差真值必须使用全面调查资料。为了描述估计效果的好坏,必须给出依据样本能对估计量方差进行估计的方法,这就是构造估计量方差的估计量,有了样本数据由此可给出估计量方差的估计值。
第四,在大规模社会经济抽样调查中,取得调查数据后,后期数据处理工作通常异常巨大,为了使数据处理尽可能简便,应尽可能采用自加权估计量,即估计量能表示成样本调查值之和与某一固定常数乘积的形式,从而大大简化估计量冗繁的计算。同时也有助于简化估计量方差的估计量的计算。在构造估计量时,兼顾估计量应具有良好的性质同时又具有方便的计算形式是这一阶段设计时必须周密考虑的问题。