与一元线性回归模型的检验类似,多元线性回归模型也可用拟合优度系数去检验其回归效果。检验思想也是从对被解释变量y取值变化的成因分析入手。
被解释变量y的变化可由两部分解释:
第一,由k个解释变量x的变化引起的y的变化部分;
第二,由其他随机因素引起的y的变化部分。由第一部分引起的y的变化的离差平方和记为SSR,称为回归平方和;由第二部分随机因素引起的y的变化的离差平方和记为SSE,称为残差平方和;SST称为总离差平方和,其中有SST=SSR+SSE。
其中,2R 即是拟合优度系数,又称为可决系数或判定系数。拟合优度系数取值范围为 [0, 1],其取值越接近1,表明各实际样本点离样本线越近,拟合优度越高。
在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大,这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需要调整。
在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。
其中,n−k−1为残差平方和的自由度,n−1为总离差平方和的自由度。