举例说明什么是主成分分析

2021年3月3日10:40:46举例说明什么是主成分分析已关闭评论

举例说明什么是主成分分析

主成分分析是以最少的信息丢失为前提,将原有变量通过线性组合的方式综合成少数几个新变量;

用新变量代替原有变量参与数据建模,这样可以大大减少分析过程中的计算工作量;

主成分对新变量的选取不是对原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息;

同时选取的新变量之间互不相关,能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。

例如,英国统计学家斯科特(Scott)1961年曾对英国157个城镇发展水平进行研究。调查得到影响城镇发展水平的57个原始变量,由于计算和研究非常烦琐,他经过主成分分析发现,用原来变量的线性组合构造5个新变量,可以以95%的精确度概括原始数据的信息。显然,研究5个变量的变化和数据的关系,比57个变量要更加快捷有效。主成分分析通过降维的方式,达到了简化数据的目的。当然,主成分分析的结果往往不是研究的最终结果,而是作为其他研究方法的辅助手段使用。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。