样本容量是指一个样本中的抽样单位数目。在进行抽样调查时,如果样本容量过大,就会增加调查工作量,造成人力、物力、财力及时间的浪费;如果样本容量过小,则样本对总体缺乏代表性,估计误差也会增大。因此,调查时应科学合理地确定样本容量。
样本容量的确定比较复杂,需要进行定量计算,也需要对问题进行定性分析。需要考虑总体规模、允许误差、总体方差、置信水平以及经费限制等因素。从理论上确定必要样本容量有相应的统计公式,用公式计算时,样本容量的大小取决于以下5个因素。
(1)数据离散程度,通常用总体标准差σ来度量。σ反映了总体内部各单位变量值之间的差异程度,在其他条件相同的情况下,有较大标准差的总体,样本容量应该大一些,反之则可以小一些。总体标准差σ的大小与样本容量n的大小成正比。
(2)概率保证程度,即置信水平1−α的高低。概率保证程度说明了估计的可靠程度。在其他条件不变的情况下,如果要求较高的概率保证程度,就要增大样本容量;反之,可以相应地减少样本容量。概率保证程度或置信水平与样本容量成正比。
(3)允许误差,即边际误差E的大小。允许误差说明了估计的精度,在其他条件不变的情况下,如果要求估计的精度高,允许误差就小,那么样本容量就要大一些;如要求的精度不高,允许误差可以大些,则样本容量可以小一些。允许误差与样本容量成反比。
(4)抽样方法。在相同的条件下,重复抽样的抽样平均误差比不重复抽样的抽样平均误差大,所以,重复抽样需要使用更大的样本容量,而不重复抽样的样本容量可小一些。
(5)抽样组织方式。必要样本容量还受抽样组织方式的影响,因为不同的抽样组织方式有不同的抽样平均误差。针对同一个研究对象,采用不同的抽样组织方式也会有不同的样本代表效果。例如,分层抽样比简单随机抽样需要更少的样本容量。
