测试的信度反映了测量的可靠性或稳定性。
信度可分为内部信度(Internal Reliability)和外部信度(External Reliability)。
内部信度指所测试各题项是否测试的同一个概念,以及组成量表或试题的题项之间的内在一致性程度如何。内部信度最常用的检验方法是克朗巴哈 α 系数和分半信度。外部信度指对相同的测试者在不同的时间进行测量时,其结果具有的一致性程度。检验外部信度最常用的方式是重测信度。
进行信度分析,就是要获得信度系数。信度系数的值在0到1之间,其值越大,表示测量的可靠程度越大。信度系数应多大才表示测试的分数是可靠的呢?这与研究目的和测验分数的运用有关。如果研究目的在于编制预测问卷或某种先导性测量,信度系数在0.60附近波动都可接受。如果测试分数是用来筛选人才,则信度系数最好在0.90以上。一般来说,信度系数在0.90以上,表明测试的信度甚佳;信度系数在0.80~0.90,表明测试的信度相当好;信度系数在0.70~0.80,表明测试可以接受,但应做些修订;如果信度系数低于0.70,表明测试存在较大问题。如果总测试的信度系数在0.70以下、分量表的内部一致性系数在0.60以下,应考虑重新修订测试或增删题项。
例如,一份英语试卷的阅读理解部分由12道客观题组成,将该试题施测于一组10人的被试。如果我们要检验构成这份英语测试试卷阅读部分的12道题目之间是否存在一致性,就需要对这套试卷的阅读部分进行内部信度的分析。相反,如果我们要检验这份英语测试试卷在不同的时间施考给同组学生时,其得出的结果是否存在一致性,这就是进行外部信度分析。