因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。
因子分析通常包括以下四个基本步骤。
1. 确定原有变量是否适合进行因子分析
因子分析的目的,是从原有众多的变量中综合出少量具有代表意义的因子变量,这必定有一个潜在的前提要求,即原有变量之间应具有较强的相关关系。不难理解,如果原有变量之间不存在较强的相关关系,那么根本无法从中综合出能够反映某些变量共同特性的几个较少的公因子变量来。因此,一般在因子分析时,需要对原有变量进行相关分析。最简单的方法是计算变量之间的相关系数矩阵并进行统计检验。如果相关系数矩阵中的大部分相关系数都小于0.3且末通过统计检验,那么,这些变量就不适合作因子分析。
2. 确定因子变量
构造因子变量是因子分析的关键步骤之一。因子分析中有多种确定因子变量的方法,根据所依据的准则不同,一般可以分为两类:一类是基于主成分分析模型的主成分分析法,另一类是基于前面介绍的公因子模型的公因子分析法,包括主轴因子法、极大似然法、最小二乘法、alpha法等。
3. 因子变量的命名解释
因子变量的命名解释是因子分析的另一个核心问题。对上面计算得到的因子载荷u ij 进行观察,一般会发现这样的现象:u ij 的绝对值可能在某一行的许多列上都有较大的取值,或u ij 的绝对值可能在某一列的许多行上都有较大的取值。这表明:某个观测变量x i 可能同时与几个因子变量都有比较大的相关关系。也就是说,某个观测变量x i 的信息需要由若干个因子变量来共同解释;同时,虽然一个因子变量可能能够解释许多变量的信息,但它却只能解释某个变量的一少部分信息,不是任何一个变量的典型代表。这样的情况必然使得某个因子变量的实际含义模糊不清。而实际分析工作中,人们却希望对因子变量的含义有比较清楚的认识。因此,希望通过某种手段便每个变量在尽可能少的因子上又有比较高的载荷,即:在理想状态下,让某个变量在某个因子上的载荷趋于1,而在其他因子上的载荷趋于0。这样,一个因子变量就能够成为某个变量的典型代表,那么它的实际含义也就清楚了。
实现上述目标的方法是对因子载荷矩阵进行旋转。可以从载荷散点图上来直观理解旋转的含义,以因子变量为坐标轴绘制原有变量的散点图。经过坐标旋转后,观测变量点应出现在靠近轴的端点和圆点附近。在轴的端点上变量是只在那个因子上有较高载荷的变量,靠近图的圆点的变量对两个因子都具有小的载荷。当然,不靠近轴的变量是被两个因子共同解释,旋转后应尽可能少地出现这种情况。
4. 计算因子值
计算因子得分呢?这里的一个基本思想是将因子变量表示为观测变量的线性组合,即通过以下的因子得分函数计算因子值:
因子分析模型中是用因子的线性组合来表示观察变量,因子载荷实际是该线性组合的权数。求因子值的过程正好相反,它是通过观测变量的线性组合来表示因子,因子值是观测变量的加权平均,这一点与主成分分析中主成分的求解过程相一致。因此,用主成分分析法得到的因子解,可直接得到因子系数。对于其他方法得到的因子解,可以用回归法、Bartlette法等方法得到因子值系数的估计值。