Stata软件的内生性与2SLS:基本原理
在普通最小二乘法的经典假设中,条件期望零值假定E(ε|X)=0可以保证估计系数的一致性。如果这个假设无法成立,就无法保证估计的一致性。通常有3种原因可能会导致内生性的问题,主要有遗漏变量、反向因果和测量误差。
如果出现了内生性问题,那么通常的解决方法是使用工具变量,利用两阶段最小二乘方法进行解决。工具变量必须满足两个条件:一是工具变量与内生变量相关;二是工具变量与随机扰动项不相关。假设方程:y= +x 2 β 2 +ε,模型中只有x 2 是内生变量,设法找到工具变量z 2 ,然后进行两阶段最小二乘法。
- 第一阶段回归:内生变量对所有解释变量进行回归分析,得到内生解释变量的估计值 X2 。
- 第二阶段回归:执行被解释变量与外生解释变量、内生解释变量一阶段回归拟合值的回归。
若模型不存在内生性问题,则IV法估计量和OLS估计量是一致的,但是OLS估计量更有效率(OLS估计量方差更小)。若存在内生性问题,则只有IV法是一致的。豪斯曼检验正是采用了这一基本思想。其原假设H 0 :所有解释变量都是外生的。在大样本下,若 依概率收敛到0,则H 0 成立,否则说明模型存在内生性。