主成分分析的基本步骤
第1步,原始数据的标准化处理。
第2步,计算相关系数矩阵 R 。
第3步,计算相关系数矩阵 R 的特征值 λ 1 ≥ λ 2 ≥ …≥ λ p 和对应的单位特征向量 e 1 , e 2 ,…, e p 。
第4步,计算主成分的方差贡献率和累积方差贡献率。
主成分的提取,可以遵循以下几个原则。
◇ 主成分的累积贡献率:一般来说,提取主成分的累积贡献率达到80%~85%以上就比较满意了,可以由此确定需要提取多少个主成分。
◇ 特征值:特征值在某种程度上可以看成表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入原变量的平均解释力度大。因此一般可以用特征值大于1作为纳入标准。
◇ 综合判断:大量的实际情况表明,如果根据累积贡献率来确定主成分数往往较多,而用特征值来确定又往往较少,很多时候应当将两者结合起来,以综合确定合适的数量。
第5步,计算主成分。