了解总体参数是横断面研究的一个主要目的,但是研究结果常常会存在系统误差,又称为偏倚(bias),系统误差属于非抽样误差(non-sampling error)。
它不仅存在于概率抽样研究,而且存在于其他非概率抽样与非全面调查,甚至普查中。偏倚不能像抽样误差那样可以进行估算,也不能通过增加样本含量而得到控制,偏倚对调查结果的影响却非常大。在某些情况下,由于偏倚没有得到有效控制,会造成研究结果的失真。有效地防止和控制偏倚是保证研究结果真实可靠的关键环节,在研究的设计、实施、数据收集、数据整理与分析等过程中均应设法控制偏倚。
选择偏倚
1.选择偏倚
选择偏倚(selection bias)是指所调查的对象不能代表所要研究的总体。选择偏倚也称为抽样框误差,抽样框是有关总体全部观察单位的名录,用作抽取样本观察单位的依据。为了更好地理解选择偏倚,首先了解两个基本概念:目标总体(target population)即真正的研究对象的全体;抽样总体(sampling population)是用作抽样的总体,也就是抽样框。理想的抽样框要尽可能做到两个总体的一致,否则就会产生选择偏倚。
2.选择偏倚主要来自以下四个方面
(1) 抽样框没有覆盖总体中全部观察单位,因此造成的偏倚影响较大,且不易被发现。
(2) 抽样框包含了非目标总体观察单位,该种偏倚容易被察觉,影响较小。
(3) 抽样框中的观察单位与目标总体观察单位非一一对应,即存在着复合连接。如入户调查房屋市场经济的研究中,采用系统抽样设计,抽样框采用街区门牌号,当目标总体的房型分布有规律时会产生房型偏倚。
(4) 在使用分层抽样、整群抽样等复杂抽样框时,如果抽样框的辅助信息不完整或不正确会导致偏倚。
3.控制方法
在研究设计阶段确定抽样框,即抽样范围时,要求全面、真实、无重复、界定明确等。