用时间序列方法对全球温度异常建模, 目的不是证明全球变暖, 而是: Show
全球温度异常值的数据来源有:
这里使用的数据来自GISS,NCDC的数据也可以得到类似结果。 数据为地面空气温度异常值的月度平均值, 从1880年1月到2010年8月,单位是0.01摄氏度。 数据读入与探索性分析读入数据,保存为ts时间序列对象:
时间序列图:
图14.1: 全球温度异常值月度时间序列 可以看到从1980年代开始有明显的上升趋势。 序列的波动性(方差)未见变大。 温度序列的ACF:
图14.2: 全球温度异常值的ACF 这样的ACF是缓慢下降的,一般为单位根非平稳或者有接近1的特征根的ARMA模型。 差分序列的时间序列图:
图14.3: 全球温度异常值的差分序列 差分序列的ACF:
图14.4: 全球温度异常值差分序列的ACF ACF是快速衰减的, 只有滞后1是明显显著的,其它滞后位置即使超过了0.05水平界限也仅是刚刚超过。 可以考虑MA(1)模型。 差分序列的PACF:
图14.5: 全球温度异常值差分序列的PACF PACF是快速衰减的, 从PACF看不能用低阶AR建模。 单位根非平稳模型因为序列有明显趋势, 而且ACF衰减缓慢, 考虑用单位根非平稳模型, 计算序列的差分。 记\(\{ G_t \}\)为温度异常值序列, 对\(\Delta G_t = G_t - G_{t-1}\)建模。 用AIC作AR定阶:
AIC给出12阶,因为是月度数据, 所以滞后12出现是合理的。 考察AR(12)的系数估计的SE:
AR(12)的模型无法精简。 这个模型的阶数太高了。 考虑MA模型。MA(1):
MA(1)模型的AIC为13332.14, 不如AR(12)的13276.33。 考虑MA(2):
MA(2)的AIC为13289.76, 还是不如AR(12)的13276.33。 考虑MA(12):
MA(12)的AIC为13245.52, 远好于AR(12)的13276.33。 拟合精简的MA(12):
最后选择了一个MA(12)限制滞后6、7、9、11系数为零。 考察这个模型的诊断:
图14.6: 稀疏系数MA(12)模型诊断 残差有重尾现象,除此之外比较符合白噪声要求。 在Ljung-Box检验使用自相关系数个数很多时会有拒绝白噪声假设的问题。 考虑用ARMA。 ARIMA(1,1,1):
效果不如刚才的MA(12)。 考察其模型诊断:
模型诊断表明ARIMA(1,1,1)是不充分的。 考虑ARIMA(1,1,2)模型:
其AIC为13241.11, 比稀疏系数MA(12)的13239.65略差, 但是模型更简单。 作模型诊断:
Ljung-Box检验的结果比MA(12)的结果差。 尝试加入一个季节MA项:
加入的季节MA系数不显著,AIC变差一些。 继续尝试加入滞后24的季节MA:
此模型的AIC在比较的模型中最优。 进行模型诊断:
图14.7: ARIMA\((1,1,2)(0,0,2)_{12}\)模型诊断 模型诊断图表明模型基本充分, 但也有一些缺陷:残差可能存在较多异常值, LB白噪声检验结果接近于拒绝白噪声假设。 在单位根非平稳模型中可以选定这个模型。 模型写成: \[ (1 - 0.7612 B)(1-B) G_t = (1 + 0.0717 B^{24})(1 - 1.3241 B + 0.3416 B^2) \varepsilon_t, \\ \ \text{Var}(\varepsilon_t) = 270.6 \] AIC值为11234.4。 线性固定趋势模型由于温度时间序列存在明显的上升趋势, 一种候选模型是固定趋势模型。 最简单的固定趋势是线性趋势: \[ G_t = \beta_0 + \beta_1 t + z_t \] 其中\(\{ z_t \}\)为线性时间序列。 先做简单的回归:
将估计的趋势叠加到原始序列图形上面:
图14.8: 非随机线性趋势 这个模型拟合的效果还是不够精细。 后面可以再设法改进。 考察回归的残差。 残差序列图:
图14.9: 非随机线性趋势残差序列 残差序列的ACF:
图14.10: 非随机线性趋势残差序列ACF 基本可以算是快速衰减,但不能用低阶MA表示。 残差序列的PACF:
图14.11: 非随机线性趋势残差序列PACF 可以算是快速衰减, 用低阶AR建模也有一定困难。 从回归残差看可以认为残差是线性平稳列, 称这样的\(G_t\)为趋势平稳序列。 对回归残差采用ARMA(2,1)模型:
模型可以写成 \[ \begin{aligned} G_t =& -38.8493 + 0.0530 t + z_t \\ z_t =& 1.2385 z_{t-1} - 0.2719 z_{t-2} + \varepsilon_t - 0.7802 \varepsilon_{t-1}, \ \text{Var}(\varepsilon_t) = 272.9 \end{aligned} \] 对其进行模型诊断:
图14.12: 线性趋势模型诊断 结果基本可以接受, ACF在滞后24处略超出0.05界限。 考虑加入滞后24的MA项看是否有改进:
从AIC来看是有明显改进的。 但是,AIC比较不如单位根非平稳模型的结果。 模型为: \[ \begin{aligned} G_t =& -38.7150 + 0.0529 t + z_t \\ (1 -1.1960B + 0.2394B^2)z_t =& (1 - 0.7451B)(1 + 0.0856B^{24})\varepsilon_t, \ \text{Var}(\varepsilon_t) = 270.8 \end{aligned} \] 对此模型的残差诊断图:
图14.13: 趋势平稳改进模型的诊断图 结果表明模型比较充分。 在趋势平稳假定下选择这个模型。 从估计结果看, 平均每月气温增长0.000529摄氏度, 平均每年气温增长0.006348摄氏度, 平均158年增加1摄氏度。 二次固定趋势模型温度异常值时间序列的增长趋势不像是线性的, 在最后四十年增长更快。 比较简单的非线性函数是二次多项式函数。 模型为 \[ G_t = \beta_0 + \beta_1 t + \beta_2 t^2 + z_t \] 其中\(\{ z_t \}\)为线性时间序列。 先做简单的回归:
将估计的趋势叠加到原始序列图形上面:
图14.14: 非随机二次多项式趋势 考察回归的残差。 残差序列图:
图14.15: 非随机二次多项式趋势残差序列 残差序列仍呈现出非平稳。 残差序列的ACF:
图14.16: 非随机线性趋势残差序列ACF 此ACF不能用低阶MA表示。 PACF为:
图14.17: 非随机线性趋势残差序列PACF PACF表现像是低阶AR模型。 用AIC确定一个AR模型:
用
对残差考虑ARMA建模。 ARMA(1,1):
效果不如AR(8)。 改为ARMA(1,2):
改为ARMA(2,1):
增加一个滞后24的季节MA项:
删去SMA1系数:
方程可以写成: \[ G_t = -46.88 + 0.0522 t + 4.109\times 10^{-5} (t - 784.5)^2 + z_t \\ z_t = 1.16 z_{t-1} - 0.22 z_{t-2} + (1 - 0.7141B)(1 + 0.0849B^{24}) \varepsilon_t \\ \text{Var}(\varepsilon_t)=268.9 \] 模型的残差诊断:
图14.18: 二次趋势模型建模的残差诊断 模型比较前面考虑了多个模型,以下的三个模型是选择出来较好的, 对模型残差的检验也能证明模型充分。 如何比较效果相近的模型? 使用差分平稳模型(随机趋势模型)时, 选用ARIMA\((1,1,2)(0,0,2)_{12}\)且季节MA滞后1系数为零。
使用非随机线性趋势模型时, 残差选用ARIMA\((2,0,1)(0,0,2)_{12}\)且季节MA滞后1系数为零。
使用非随机二次多项式趋势模型时, 残差选用ARIMA\((2,0,1)(0,0,2)_{12}\)且季节MA滞后1系数为零。
样本内比较可以用对建模用数据的拟合情况比较模型优劣, 在所用的参数个数相近的情况下比较是有意义的。 比较可以用:
从AIC来看, 应该是MC1的随机趋势模型最好, 其AIC=13234最小。 但是,不同的模型有完全不同的含义。 对于随机趋势模型, 它可以拟合出增长趋势, 但是模型并不意味着以后也会持续增长, 差分平稳模型完全可以表现出下降趋势。 对于非随机线性增长趋势模型, 因为有一个显著的线性增长项, 模型意味着以后温度也持续线性增长, 增长速度为每年0.00635度, 平均157年增长1摄氏度。 对于非随机二次增长趋势模型, 因为有一个显著的二次增长项, 模型意味着以后温度会加速增长, 从数据末尾的2010年8月的异常值74开始, 增加1摄氏度只需87年。 从现有的数据无法确定随机趋势模型还是非随机趋势模型更正确, 相对于全球温度变化这种缓慢变化, 现有的130数据还是太少了, 不足以反映整个历史中或较近的历史中的全球气温变化。 就好比我们在三年的时间观测到了股市为牛市, 就断言后面也是牛市一样不可信。 样本外比较样本外比较的思想是, 建模时留出最后一部分时间不用于建模, 建模后对留出的时间做超前一步预报, 比较平均预报误差。 共有1568个月的数据, 取最后的200个月的数据作为验证。 使用MC1作预测的函数:
使用MC2作预测的函数:
使用MC3作预测的函数:
对一种方法的预测计算预测根均方误差(RMFSE)和平均绝对预测误差(MAFE)的函数:
计算这三个候选模型的预测误差指标:
预测误差比较的结果表格:
样本外预测的结果也是随机趋势模型MC1最好。 长期预测用MC1作超前1到1200步(共100年)的长期预测, 并作图:
图14.19: 随机趋势模型的100年长期预测 可见随机趋势的预测结果基本是用最后一个有数据的月份的数据作为预测值, 预测的区间越来越宽。 用MC3作超前1到1200步(共100年)的长期预测, 并作图:
图14.20: 非随机二次趋势模型的100年长期预测 非随机二次多项式趋势的模型给出了一个二次多项式增长长期预测, 而且预测的区间长度略增长后就稳定不变。 预测方差最后趋于固定趋势回归的残差方差。 两个长期预测模型给出截然不同的结果, 也无法证明哪一个结果正确, 则两个结果都不能作为长期预测结果。 讨论这个例子展示了如何从序列图、差分、ACF、PACF等发现可能的建模方向, 如何逐步改善模型, 随机趋势与非随机趋势的比较与各自的建模步骤, 如何比较模型,长期预报,等等。 下面对一些其他重要问题进行讨论。 模型的不确定性所有的模型都是错误的, 只不过其中一部分是有用的。 模型是所分析过程的近似。 模型的不确定性一方面来自样本的随机性以及由此而来的参数估计的随机误差, 还来自于不同模型选择的不确定性。 统计推断时应尽可能考虑这些不确定性。 时间序列分析中模型的不确定性可以通过模型平均来对抗。 比如, 全球温度异常模型的短期预测可以用三个模型的预测的简单平均计算, 但也仅适用于短期预测。 短期预测与长期预测目标是短期预测还是长期预测可能会影响模型选择, 甚至于超前一步预测最优的模型不一定是超前两步预测最优的。 文献中有自适应预测研究,见(Tiao and Tsay 1994)。 分段非随机趋势模型从数据的时间序列图观察,在大约1980年以后斜率明显增加。 所以,设计一个斜率分为两段的模型: \[ y_t = \beta_0 + (\beta_1 + \beta_2 I_t) t + \eta_t, \] 其中\(I_t\)为\(t > 1212\)的示性函数, 1212对应于1980年12月, 上述模型的回归斜率项在1980年12月之前为\(\beta_1\), 在1980年12月之后为\(\beta_1 + \beta_2\)。 令\(x_t = I_t t\),则模型可以写成 \[ y_t = \beta_0 + \beta_1 t + \beta_2 x_t + \eta_t . \]
增加季节项:
删去不显著的Sma1项:
这个模型的AIC是现有的模型中最好的。 从结果中xt自变量的估计值和标准误差比值看, 这一项是显著的,即认为\(\beta_2 \neq 0\), 说明分段是成立的。 残差诊断:
图14.21: 分段模型的残差诊断 基本可以接受残差诊断结果。Ljung-Box白噪声诊断:
这个模型从1981年开始温度的月升高率为\((0.0317+0.0219)=0.0536\), 年升高率为0.6432,即每年增加\(0.006432\)度, 平均155年增加1摄氏度。 虽然这个模型的样本内比较AIC结果最好, 但是并不推荐这种做法, 因为过于追求样本内的拟合优度往往导致过度拟合, 在样本外预测反而变差。 既然斜率可以变化, 那么未来斜率也可以变化, 作长期预测时因为未来的斜率变化不可知所以也不能用来做长期预测。 这里因为增长率加大以后样本量少所以不再比较样本外预测。 其它的数据前面所用的全球气温异常数据来自GISS。 其它数据来源的数据建模也应得到类似结果。 这里使用NCDC和NOAA的数据, 单位为摄氏度。 读入数据:
建立与MC1类似的模型:
因为数据不同, 这里的AIC不能与前一数据的模型的AIC比较。 模型诊断:
图14.22: 用NCDC和NOAA数据建立随机趋势模型的诊断 诊断说明模型是可取的。 样本外比较略。 参考文献Tiao, G. C., and R. S. Tsay. 1994. “Some Advances in Non-Linear and Adaptive Modeling in Time Series.” Journal of Forecasting, 13109–31. |