(一)数据审核的内容
1.完整性 即研究所需的资料是否全部得到,有无缺项、漏项等现象。完整性是保证资料质量的基础,主要检查原始资料有无遗漏或重复,内容是否齐全。
2.真实性 即判断原始资料有无伪造、篡改数据等现象。真实性是对资料最基本的要求。
3.准确性 即原始资料是否准确、可靠。准确性是资料质量的核心,资料不准确将导致错误的结论。
4.及时性 即是否按时获取资料,有无拖延。及时是保证资料完整性的先决条件。若未能在规定期限内完成资料的搜集,应检查其原因,并提出改进和解决的办法。
5.可比性 即资料的信息来源、抽样方法、样本含量、基线资料、选择条件、观测或试验条件、相关标准等方面是否相同或相似,是否具有可比性。
(二)数据审核的方法
1.缺项检查
缺项指对调查表中某些项目未予回答。若所缺项目对于研究来说必不可少,那么这部分调查表就成了废表,需予以剔除,如儿童生长发育调查中的儿童性别、年龄。有时,虽然所缺项目的内容也非常重要,但为了避免因剔除过多而导致的调查表回收率过低,就对缺项作为单项缺失进行处理。例如,调查1500名正常成年人的血液红细胞、白细胞、血小板正常值范围,其中有3人血小板数未填入,那么在统计红细胞和白细胞时可按1500人计算,而统计血小板时以1497人计算。
2.范围检查
包括两方面:
①已调查或研究的个体是否属于规定的研究对象范围?如在胃癌流行病学调查的病例-对照研究中,对病例组首先要确认胃癌患者的诊断无误。如果有慢性胃炎、胃溃疡等患者混入,则调查结果易出现假象。
②是否存在调查或研究对象的漏失问题?应调查对象的调查率当然越高越好,但实际工作中很难做到100%。为了避免和减少因调查率太低而引起的资料偏性,对调查对象一般除了出差、病危等特殊情况外,其他都应调查到。
3.专业检查
即从专业的角度来发现和纠正错误,如在某些调查表中出现女性病人患阴茎癌、6岁孩子患中风等明显错误的情况,对于这种调查表应予以作废。
4.统计检查
即按统计学要求发现和纠正错误。许多数据都有统计规律,如事物内部各部分构成比之和必须等于100%,符合正态分布的指标数值在均数加减2.58倍标准差范围内的应占99%。
5.逻辑检查
即根据指标本身或指标间的内在联系,利用逻辑关系检查指标之间或数据之间有无矛盾。如统计表中,横向、纵向的合计和总合计是否吻合。对不合理或错误的项目必须复查、纠正或舍弃。
6.计算机检查
传统的资料检查方法是以人工方式逐份对调查表做检查,虽然检查全面,但工作量大、易出现遗漏。而借助计算机,把资料内容编写为程序,进行独立双份双机录入,计算机程序就会对数据库中的数据进行一致性检查,准确无误地判断出两次录入的不吻合之处,并生成数据校正表,便于研究者校对、修改直至两个库完全一致。但计算机一般只能检查出逻辑性错误和录入错误,或者进行简单的专业检查。实际应用中,可把人工检查和计算机检查结合起来,以保证数据的质量。