很多时间序列呈现出季节性周期变化,例如空调的销售数量夏天较多、冬天较少。对于这类数据,我们可以通过季节ARIMA(Seasonal ARIMA,简记为SARIMA)模型进行拟合。一般形式的SARIMA模型可以写为:
其中,下标p、q分别表示非季节自回归、移动平均算子的最大滞后阶数,P、Q分别表示季节自回归、移动平均算子的最大滞后阶数;d、D分别表示非季节和季节性差分次数。上式被称作(p,d,q) ×(P,D,Q) s 阶季节时间序列模型。
通常情况下,对于(p,d,q) ×(P,D,Q) s 阶SARIMA模型,d和D为0或1,p、q、P、Q一般也不超过2或3。对于季度数据,s通常为4;对于月度数据,s通常为12。
为了更清楚地阐释概念,让我们考虑(1,1,2) ×(2,1,1) 4 阶SARIMA模型。该模型可以写为:
(1-ρ 1 L)(1-ρ 4,1 L 4 -ρ 4,2 L 8 )∆∆ 4 y t =(1+θ 1 L+θ 2 L 2 )(1+θ 4,1 L 4 )ε t
对于符号(1,1,2) ×(2,1,1) 4 ,(1,1,2)表示有一个非季节自回归项(1-ρ 1 L)、一个非季节移动平均项(1+θ 1 L+θ 2 L 2 )且对序列进行一阶差分;(2,1,1) 4 表示有一个滞后4阶季节自回归项(1-ρ 4,1 L 4 -ρ 4,2 L 8 )、一个滞后4阶季节移动平均项(1+θ 4,1 L 4 )并对序列进行一次季节差分。因为非季节因子和季节因子以乘积的形式出现,所以这种模型也被称为乘积SARIMA。
如果序列的时间趋势图显示季节效应与序列均值成比例,那么乘积SARIMA会比较恰当。建议先对有季节效应的数据拟合乘积SARIMA模型,如果拟合不好,再尝试非乘积形式。Chatfield (2004)则指出,对数据取对数会使季节效应呈现加法形式。我们在实际的研究中可以两种形式都进行尝试,哪种形式对模型拟合和预测得好就采用哪种形式。