简单线性回归方程:什么意思、回归系数、计算公式
在相关图中,如果自变量与因变量对应的散点近似为直线,或计算出的相关系数具有显著的直线相关关系时,则可以使用简单线性回归方程来描述自变量与因变量之间的相关关系。其方程式为
y c = a + bx
式中, a 和 b 是确定该直线方程的两个待定参数, a 代表直线的起点值,在数学上称为直线的纵轴截距; b 代表自变量增加一个单位时因变量的平均增加值,数学上称为斜率,也称回归系数。一旦解出 a 和 b ,表明变量之间一般关系的回归直线就可以确定下来。
使用简单线性回归方程模型,应当遵循以下条件。
(1)两个变量之间确实存在显著或显著以上的相关关系。如果两个变量之间没有相关关系或相关程度不显著,则所配合的线性回归方程对两个变量之间的数量依存关系的代表性就不够,计算结果与实际情况之间误差太大,没有应用价值。
(2)两个变量之间确实存在直线相关关系。将两个变量的对应值绘制成散点图,只有当图上各点的分布呈近似直线的趋势时,才能使用简单线性回归方程。
(3)应用最小平方法(最小二乘法)原理确定两个待定参数 a 和 b 。使用最小平方法可以使因变量实际值与理论值离差的代数和等于零,即∑( y - y c )=0,从而使离差的平方和为最小,即∑( y - y c ) 2 为最小值,因而最具有代表性,是最佳的回归直线模型。
根据最小平方法计算简单线性回归方程参数的计算公式为