Stata软件的ARIMA模型:基本原理
最简单的时间序列模型是单变量时间序列,主要有4种,即自回归模型(Auto Regression,记为AR)、移动平均模型(Moving Average,记为MA)、自回归移动平均模型(Auto Regression Moving Average,记为ARMA)和单整自回归移动平均模型(Integrated Auto Regression Moving Average,记为ARIMA)。
一个剔除均值和确定性成分的线性过程可表达为:
y t =β 0 +β 1 y t-1 +…+β p y t-p +ε t
其中, {ε t }是白噪声序列,则称y t 为p阶自回归过程,用AR(p)表示。
一个剔出均值和确定性成分的线性随机过程可用下式表达:
y t =μ+ε t +θ 1 ε t-1 +θ 2 ε t-2 +…+θ q ε t-q
其中,{ε t }为白噪声,则上式称为q阶移动平均过程,记为MA(q)。
由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA( p,q)。ARMA( p,q)的一般表达式为:
y t =β 0 +β 1 y t-1 +…+β p y t-p +ε t +θ 1 ε t-1 +…+θ q ε t-q
其中,{ε t }为白噪声。
为了简化符号,引入滞后算子L,其定义为Ly t =y t-1 ,L p y t =y t-p 。当β 0 =0时,ARMA(p,q)模型可以写为(1-β 1 L-…-β p L p )y t =(1+θ 1 L+…+θ q L q )ε t ,简写成Φ p (L)y t =Θ q (L)ε t 。
以上介绍了3种平稳的随机过程。对于ARMA过程(包括AR过程),如果特征方程Φ p (L)=0的全部根取值在单位圆之外,该过程就是平稳的;如果若干个或全部根取值在单位圆之内,该过程就是强非平稳的。除此之外,还有第3种情形,即特征方程的若干根取值恰好在单位圆上,这种根称为单位根,这种过程也是非平稳的。
对于这种情况,序列进行差分之后就可以实现平稳。经过d阶差分变换后的ARMA(p,q)模型称为ARIMA(p,d,q)模型。
最后,在模型识别上,可以利用AR模型和MA模型自身的一些性质。AR(p)模型的PACF函数p阶截尾,ACF函数拖尾;MA(q)模型的ACF函数q阶截尾,PACF函数拖尾;ARMA(p,q)模型(p和q都不为0)则是ACF函数与PACF函数都拖尾。经验表明,在大多数情况下,p+q≤5就足够了。在实践中判断滞后阶数时可以使用信息准则,选择AIC或BIC最小的p、q组合。
在估计完模型之后,需要检验残差项{ε t }是否为白噪声。若不是白噪声,则应考虑增加阶数,重新估计模型,直至残差为白噪声。