关于数据挖掘:ARMAEGARCH模型集成预测算法对SPX实际波动率进行预测附代码数据

咱们被要求在本周提供一个报告，该报告将联合 ARMA-EGARCH，集成预测算法等数值办法

本文比拟了几个工夫序列模型，以预测 SP500 指数的每日理论稳定率。基准是 SPX 日收益序列的 ARMA-EGARCH 模型。将其与 GARCH 模型进行比拟。最初，提出了汇合预测算法

理论稳定率是看不见的，因而咱们只能对其进行估算。这也是稳定率建模的难点。如果实在值未知，则很难判断预测品质。尽管如此，钻研人员为理论稳定率开发了估算模型。Andersen，Bollerslev Diebold（2008）和 Barndorff-Nielsen and Shephard（2007）以及 Shephard and Sheppard（2009）提出了一类基于高频的稳定率（HEAVY）模型，作者认为 HEAVY 模型给出了 很好的 预计。

假如：HEAVY 实现的稳定率估算器无偏且无效。

在下文中，将 HEAVY 估计量作为 察看到的已实现稳定率（理论稳定率）来确定预测性能。

SPX 每日数据（平仓收益）
SPX 盘中高频数据（HEAVY 模型预计）
VIX
VIX 衍生品（VIX 期货）

在本文中，我次要关注前两个。

我实现了 Shephard 和 Sheppard 的模型，并预计了 SPX 的理论量。

head(SPXdata)

 SPX2.rv       SPX2.r     SPX2.rs SPX2.nobs SPX2.open
2000-01-03 0.000157240 -0.010103618 0.000099500      1554  34191.16
2000-01-04 0.000298147 -0.039292183 0.000254283      1564  34195.04
2000-01-05 0.000307226  0.001749195 0.000138133      1552  34196.70
2000-01-06 0.000136238  0.001062120 0.000062000      1561  34191.43
2000-01-07 0.000092700  0.026022074 0.000024100      1540  34186.14
2000-01-10 0.000117787  0.010537636 0.000033700      1573  34191.50
           SPX2.highlow SPX2.highopen SPX2.openprice SPX2.closeprice
2000-01-03   0.02718625   0.005937756        1469.25         1454.48
2000-01-04   0.04052226   0.000000000        1455.22         1399.15
2000-01-05  -0.02550524   0.009848303        1399.42         1401.87
2000-01-06  -0.01418039   0.006958070        1402.11         1403.60
2000-01-07  -0.02806616   0.026126203        1403.45         1440.45
2000-01-10  -0.01575486   0.015754861        1441.47         1456.74
                 DATE   SPX2.rvol
2000-01-03 2000-01-03 0.012539537
2000-01-04 2000-01-04 0.017266934
2000-01-05 2000-01-05 0.017527864
2000-01-06 2000-01-06 0.011672103
2000-01-07 2000-01-07 0.009628084
2000-01-10 2000-01-10 0.010852972

SPXdata$SPX2.rv 是预计的理论方差。SPXdata$SPX2.r 是每日收益（平仓）。SPXdata$SPX2.rvol 是预计的理论稳定率

SPXdata$SPX2.rvol

思考到在条件方差中具备异方差性的每日收益，GARCH 模型能够作为拟合和预测的基准。

首先，收益序列是安稳的。

 Augmented Dickey-Fuller Test

data:  SPXdata$SPX2.r
Dickey-Fuller = -15.869, Lag order = 16, p-value = 0.01
alternative hypothesis: stationary

散布显示出尖峰和厚尾。能够通过 t 散布回归散布密度图来近似。黑线是内核平滑的密度，绿线是 t 散布密度。

点击题目查阅往期内容

ARMA-GARCH-COPULA 模型和金融工夫序列案例

左右滑动查看更多

acf(SPXdata$SPX2.r) ## 自相关系数图

 Box-Ljung test

data:  SPXdata$SPX2.r
X-squared = 26.096, df = 1, p-value = 3.249e-07

自相干图显示了每周相关性。Ljung-Box 测试确认了序列存在相关性。

Series: SPXdata$SPX2.r 
ARIMA(2,0,0) with zero mean

Coefficients:
          ar1      ar2
      -0.0839  -0.0633
s.e.   0.0154   0.0154

sigma^2 estimated as 0.0001412:  log likelihood=12624.97
AIC=-25243.94   AICc=-25243.93   BIC=-25224.92

auro.arima 示意 ARIMA（2,0,0）能够对收益序列中的自相干进行建模，而 eGARCH（1,1）在稳定率建模中很受欢迎。因而，我抉择具备 t 散布的 ARMA（2,0）-eGARCH（1,1）作为基准模型。

 *---------------------------------*
*       GARCH Model Spec          *
*---------------------------------*

Conditional Variance Dynamics
------------------------------------
GARCH Model     : eGARCH(1,1)
Variance Targeting  : FALSE 

Conditional Mean Dynamics
------------------------------------
Mean Model      : ARFIMA(2,0,0)
Include Mean        : TRUE 
GARCH-in-Mean       : FALSE 

Conditional Distribution
------------------------------------
Distribution    :  std 
Includes Skew   :  FALSE 
Includes Shape  :  TRUE 
Includes Lambda :  FALSE

我用 4189 个观测值进行了回测（从 2000-01-03 到 2016-10-06），应用前 1000 个观测值训练模型，而后每次向前滚动预测一个，而后每 5 个观测值从新预计模型一次。下图显示了样本外预测和相应的理论稳定率。

预测显示与实现稳定率高度相干，超过 72%。

cor(egarch_model$roll.pred$realized_vol, egarch_model$roll.pred$egarch.predicted_vol, 
    method = "spearman")

[1] 0.7228007

误差摘要和绘图

 Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
-0.0223800 -0.0027880 -0.0013160 -0.0009501  0.0003131  0.0477600

平均误差平方（MSE）：

[1] 1.351901e-05

realGARCH 该模型由 Hansen，Huang 和 Shek（2012）（HHS2012）提出，该模型应用非对称动力学示意将理论（已实现）稳定率测度与潜在 \_实在稳定率分割 \_起来。与规范 GARCH 模型不同，它是收益和理论稳定率度量的联结建模（本文中的 HEAVY 预计器）。

模型：

 *---------------------------------*
*       GARCH Model Spec          *
*---------------------------------*

Conditional Variance Dynamics
------------------------------------
GARCH Model     : realGARCH(2,1)
Variance Targeting  : FALSE 

Conditional Mean Dynamics
------------------------------------
Mean Model      : ARFIMA(2,0,0)
Include Mean        : TRUE 
GARCH-in-Mean       : FALSE 

Conditional Distribution
------------------------------------
Distribution    :  norm 
Includes Skew   :  FALSE 
Includes Shape  :  FALSE 
Includes Lambda :  FALSE

滚动预测过程与上述 ARMA-EGARCH 模型雷同。下图显示了样本外预测和相应的理论稳定率。

预测与理论的相关性超过 77%

cor(arfima_egarch_model$roll.pred$realized_vol, arfima_egarch_model$roll.pred$arfima_egarch.predicted_vol, 
    method = "spearman")

[1] 0.7707991

误差摘要和图：

 Min.    1st Qu.     Median       Mean    3rd Qu.       Max. 
-1.851e-02 -1.665e-03 -4.912e-04 -1.828e-05  9.482e-04  5.462e-02

均方误差（MSE）：

[1] 1.18308e-05

备注：

用于每日收益序列的 ARMA-eGARCH 模型和用于理论稳定率的 ARFIMA-eGARCH 模型利用不同的信息源。ARMA-eGARCH 模型仅波及每日收益，而 ARFIMA-eGARCH 模型基于 HEAVY 估算器，该估算器是依据日内数据计算得出的。RealGARCH 模型将它们联合在一起。
以均方误差掂量，ARFIMA-eGARCH 模型的性能略优于 realGARCH 模型。这可能是因为 ARFIMA-eGARCH 模型的 LRD 个性所致。

拓端

，赞 13

当初曾经建设了三个预测

ARMA egarch_model
realGARCH rgarch model
ARFIMA-eGARCH arfima_egarch_model

只管这三个预测显示出很高的相关性，但预计模型平均值会缩小预测方差，从而进步准确性。应用了随机森林集成。

varImpPlot(rf$model)

随机森林由 500 棵树组成，每棵树随机抉择 2 个预测以拟合理论值。下图是拟合和理论稳定率。

预测与理论稳定率的相关性：

[1] 0.840792

误差图：

均方误差：

[1] 1.197388e-05

MSE 与理论稳定率方差的比率

[1] 0.2983654

波及已理论量度信息的 realGARCH 模型和 ARFIMA-eGARCH 模型优于规范的收益序列 ARMA-eGARCH 模型。与基准相比，随机森林集成的 MSE 缩小了 17%以上。

从信息源的角度来看，realGARCH 模型和 ARFIMA-eGARCH 模型捕捉了日内高频数据中的增量信息（通过模型，HEAVY 理论稳定率估算）

以上办法不蕴含隐含稳定率数据。隐含稳定率是依据 SPX 期权计算得出的。天然的认识是将隐含稳定率作为预测已实现稳定率的预测因子。然而，大量钻研表明，无模型的隐含稳定率 VIX 是有偏估计量，不如基于过来理论稳定率的预测无效。Torben G. Andersen，Per Frederiksen 和 Arne D. Staal（2007）批准这种观点。他们的工作表明，将隐含稳定率引入工夫序列剖析框架不会带来任何显著的益处。然而，作者指出了隐含稳定率中增量信息的可能性，并提出了组合模型。

因而，进一步的倒退可能是将工夫序列预测和隐含稳定率（如果存在）的预测信息相结合的集成模型。

本文摘选《 R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测 》，点击“ 浏览原文”获取全文残缺材料。

点击题目查阅往期内容

R 语言多变量狭义正交 GARCH（GO-GARCH）模型对股市高维稳定率工夫序列拟合预测
Python 应用 GARCH，EGARCH，GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
ARMA-GARCH-COPULA 模型和金融工夫序列案例
工夫序列剖析：ARIMA GARCH 模型剖析股票价格数据
GJR-GARCH 和 GARCH 稳定率预测普尔指数工夫序列和 Mincer Zarnowitz 回归、DM 测验、JB 测验
【视频】工夫序列剖析：ARIMA-ARCH / GARCH 模型剖析股票价格
工夫序列 GARCH 模型剖析股市稳定率
PYTHON 用 GARCH、离散随机稳定率模型 DSV 模仿预计股票收益工夫序列与蒙特卡洛可视化
极值实践 EVT、POT 超阈值、GARCH 模型剖析股票指数 VaR、条件 CVaR：多元化投资组合预测危险测度剖析
Garch 稳定率预测的区制转移交易策略
金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言危险价值：ARIMA，GARCH，Delta-normal 法滚动预计 VaR（Value at Risk）和回测剖析股票数据
R 语言 GARCH 建模罕用软件包比拟、拟合规范普尔 SP 500 指数稳定率工夫序列和预测可视化
Python 金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
MATLAB 用 GARCH 模型对股票市场收益率工夫序列稳定的拟合与预测 R 语言 GARCH-DCC 模型和 DCC（MVT）建模预计
Python 用 ARIMA、GARCH 模型预测剖析股票市场收益率工夫序列
R 语言中的工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言 ARIMA-GARCH 稳定率模型预测股票市场苹果公司日收益率工夫序列
Python 应用 GARCH，EGARCH，GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
R 语言工夫序列 GARCH 模型剖析股市稳定率
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
Python 应用 GARCH，EGARCH，GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
应用 R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略
R 语言用多元 ARMA,GARCH ,EWMA, ETS, 随机稳定率 SV 模型对金融工夫序列数据建模
R 语言股票市场指数：ARMA-GARCH 模型和对数收益率数据探索性剖析
R 语言多元 Copula GARCH 模型工夫序列预测
R 语言应用多元 AR-GARCH 模型掂量市场危险
R 语言中的工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言用 Garch 模型和回归模型对股票价格剖析
GARCH（1,1），MA 以及历史模拟法的 VaR 比拟
matlab 预计 arma garch 条件均值和方差模型 R 语言 POT 超阈值模型和极值实践 EVT 剖析 R 语言工夫序列 GARCH 模型剖析股市稳定率
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
Python 应用 GARCH，EGARCH，GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
应用 R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略
R 语言用多元 ARMA,GARCH ,EWMA, ETS, 随机稳定率 SV 模型对金融工夫序列数据建模
R 语言股票市场指数：ARMA-GARCH 模型和对数收益率数据探索性剖析
R 语言多元 Copula GARCH 模型工夫序列预测
R 语言应用多元 AR-GARCH 模型掂量市场危险
R 语言中的工夫序列分析模型：ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言 GARCH-DCC 模型和 DCC（MVT）建模预计
R 语言用 Garch 模型和回归模型对股票价格剖析
GARCH（1,1），MA 以及历史模拟法的 VaR 比拟
matlab 预计 arma garch 条件均值和方差模型
R 语言 ARMA-GARCH-COPULA 模型和金融工夫序列案例

关于数据挖掘:ARMAEGARCH模型集成预测算法对SPX实际波动率进行预测附代码数据

全文下载链接：http://tecdat.cn/?p=12174

假如条件

数据起源

数据采集

理论稳定率预计和每日收益

基准模型：SPX 每日收益率建模

ARMA-EGARCH

改良：理论 GARCH 模型和 LRD 建模

理论 GARCH

集成模型

随机森林

备注

进一步钻研：隐含稳定率