多重共线性诊断与处理的功能与意义
多重共线性是指线性回归模型中的解释变量之间由于存在高度相关关系而使模型估计失真或难以估计准确,包括严重的多重共线性和近似的多重共线性。在进行回归分析时,如果某一自变量可以被其他的自变量通过线性组合得到,那么数据就存在严重的多重共线性问题。近似的多重共线性是指某自变量能够被其他的自变量较多地解释,或者说自变量之间存在着很大程度的信息重叠。
多重共线性产生的原因包括经济变量相关的共同趋势、滞后变量的引入、样本资料的限制等。在数据存在多重共线性的情况下,最小二乘回归分析得到的系数值仍然是最优无偏估计的,但是会导致:完全共线性下参数估计量不存在;近似共线性下OLS估计量非有效;参数估计量经济含义不合理;变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外;模型的预测功能失效。
解决多重共线性的办法包括剔除不显著的变量、进行因子分析提取出相关性较弱的几个主因子再进行回归分析、将原模型变换为差分模型、使用岭回归法减小参数估计量的方差等。