重测信度和复本信度分别注重考查测量的跨时间的一致性和跨形式的一致性,而内部一致性信度主要反映的是测验内部题目之间的关系,考查测验的各题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性信度。
1)分半信度
分半信度系数是通过将测验分成两半,然后分别计算这两部分测验之间的相关性而获得的信度系数。一般采用奇偶分半的方法,即将测验按奇数题和偶数题分成两半,并分别计算每位应试者在这两部分测验上的得分,再求出这两个分数的相关系数。这个相关系数代表了两部分测验内容取样的一致性程度,因此也称为内部一致性信度系数。
计算分半信度系数可以采用常用的积差相关方法。但是,这种相关系数实际上只是半个测验的相关系数,如100道题的测验,两半的分数实际上是从50道题中得到的,而在重测信度和复本信度中,分数是从所有100道题中得到的。在其他条件相同的情况下,测验越长,信度系数越高,而分半测验经常会低估信度,因此必须进行修正。
2)同质性信度
同质性是指所有测验题目测量的只是单一的特质或内容,表现为所有测验题目得分的一致性。例如,“3+4=?”和“4+5=?”这两个加法题是高度同质的,而“8+13=?”就与上面的题目有些不同质,因为后面涉及进位加法。
同质性是保证测验只测量单一特质的必要条件。如果同质性差,则测验中可能混合了不同的内容,其结果就无从判断究竟反映了应试者的什么特征。例如,在考查管理技能时,预测与决策、监督与控制等都是不太容易区分的,因此对题目的设计要求相当高,否则就会把不同技能混合起来,导致结论错误和用人失误。
同质性信度是指测验内部的题目在多大程度上考查了同一内容。同质性信度低时,即使各测验题目看起来似乎是测量同一特质的,但实际上测验是异质的,即测验测量了不止一种特质。例如,在测量小学数学工程类应用题时,题干表述过长且难以理解,这样一个看似测量数学应用题解决能力的测验,实际上还测量了语言理解能力,而那些语言理解能力差的人根本不可能答对试题。