在设计诊断试验时,选择的研究对象应对目标总体具有代表性。当样本受某些因素的影响不能代表总体时,这种偏倚称为选择性偏倚(selection bias)。
通常目标总体的确定应依据对诊断试验评价的阶段或目的而定。如一项新的诊断技术首次问世,研究目标为该试验对某疾病是否具有诊断价值,这时可以选择典型的某疾病患者和健康志愿者作为研究对象,以便快速排除掉一些没有任何诊断价值的试验。但是,如果诊断试验的主要目的是评价该项诊断技术能否应用于临床上不典型或早期病例的鉴别诊断,这时如果仍然选择典型的某病患者和健康志愿者,无疑会产生样本选择偏倚,从而高估试验的诊断准确度。
样本选择偏倚中最常见的一种是频谱偏倚(spectrum bias),即研究样本不包括患者特征的完整频谱,如患者总体的病理学、临床表现、患者的基本特征等。
例如某些影像学诊断癌症的试验中,体积大的癌肿或某解剖部位的癌肿比较容易被发现,因此如果样本中只包括大癌肿病例或某解剖部位的癌肿病例,会高估该诊断试验发现病例的能力(即高估灵敏度)。
又比如某些疾病的临床严重程度也会影响诊断试验灵敏度的评价,因此选择患者时要尽可能包括不同严重程度、不同病程、不同临床表现等的患者,并且各种患者构成要尽可能接近该疾病患者的总体特征。通常病情较重的患者多集中在医疗技术较好的医院,因此诊断试验中病例最好来自多家不同区域、不同级别的医院,如专科医院、普通医院、初级卫生保健机构等,以保证样本中既包括病情比较严重的患者,也包括病情较轻和中度的患者。在非患者的选择时,除考虑所研究疾病外,还要考虑其他需要鉴别诊断的疾病影响,因此广义的非患者不仅包括健康人,还包括患有需要鉴别诊断的其他疾病患者。
此外,有些疾病诊断易受研究对象的基本特征,如年龄、性别、肥胖程度等的影响,例如肥胖会提高CT的准确度,降低超声波的准确度,因此,还要注意样本中的这些基本特征能代表总体的基本特征。