在建立回归模型 y = β 0 + β 1 x + ε 时,除了假定因变量与自变量之间为线性关系外,还假定误差项 ε 是期望值为 0、方差相等且服从正态分布的一个独立随机变量。如果这些假定不成立,那么对模型所做的检验和预测也就站不住脚。确定有关 ε 的假定是否成立的方法之一就是进行残差分析(residual analysis)。
检验误差项 ε 的假定是否成立,可以通过对残差图的分析来完成。常用的残差图有关于 x 的残差图、标准化残差图等。关于 x 的残差图用横轴表示自变量 x i 的值,纵轴表示对应的残差 e i ,每个 x i 的值与对应的残差 e i 用图中的一个点来表示。
为解读残差图,首先应考察残差图的形态及其反映的信息。不同形态的残差图如图8-12 所示。
图 8-12 不同形态的残差图
(a)满意的模式;(b)非常数方差;(c)模型形式不合适
若关于 ε 等方差的假定成立,而且假定描述变量 x 和 y 之间关系的回归模型是合理的,那么残差图中的所有点都应以均值 0 为中心随机分布在一条水平带中间,如图 8-12(a)所示。但如果对所有的 x 值, ε 的方差是不同的,例如,较大的 x 值的残差也较大(或较大的 x 值的残差较小),如图 8-12(b)所示,这就意味着违背了 ε 方差相等的假设。如果残差图如图 8-12(c)所示的那样,则表明所选择的回归模型不合理,这时应考虑非线性回归模型。
【例 8-5】
绘制 15 个地区城镇居民 2017 年人均可支配收入与人均消费支出预测的残差图,判断所建立的回归模型是否合理。
解:根据表 8-4 中的残差绘制的 2017 年人均消费支出回归预测的残差图如图 8 -13所示。
图 8-13 2017 年人均消费支出回归预测的残差图
从图 8-13 可以看出,各残差基本上位于一条水平带中间,而且没有任何固定的模式,呈随机分布。这表明人均可支配收入与人均消费支出的一元线性回归模型是合理的,关于模型的各种假定也都是成立的。