原文链接:http://tecdat.cn/?p=12174

    • -

介绍

本文比拟了几个工夫序列模型,以预测SP500指数的每日理论稳定率。基准是SPX日收益序列的ARMA-EGARCH模型。将其与GARCH模型进行比拟  。最初,提出了汇合预测算法。

假如条件

理论稳定率是看不见的,因而咱们只能对其进行估算。这也是稳定率建模的难点。如果实在值未知,则很难判断预测品质。尽管如此,钻研人员为理论稳定率开发了估算模型。Andersen,Bollerslev Diebold(2008)  和  Barndorff-Nielsen and Shephard(2007)  以及  Shephard and Sheppard(2009)  提出了一类基于高频的稳定率(HEAVY)模型,作者认为HEAVY模型给出了  很好的  预计。

假如:HEAVY实现的稳定率估算器无偏且无效。

在下文中,将HEAVY估计量作为  察看到的已实现稳定率(理论稳定率) 来确定预测性能。

数据起源

  • SPX每日数据(平仓收益)
  • SPX盘中高频数据(HEAVY模型预计)
  • VIX
  • VIX衍生品(VIX期货)

在本文中,我次要关注前两个。

数据采集

理论稳定率预计和每日收益

我实现了Shephard和Sheppard的模型,并预计了SPX的理论量

head(SPXdata)

 SPX2.rv       SPX2.r     SPX2.rs SPX2.nobs SPX2.open2000-01-03 0.000157240 -0.010103618 0.000099500      1554  34191.162000-01-04 0.000298147 -0.039292183 0.000254283      1564  34195.042000-01-05 0.000307226  0.001749195 0.000138133      1552  34196.702000-01-06 0.000136238  0.001062120 0.000062000      1561  34191.432000-01-07 0.000092700  0.026022074 0.000024100      1540  34186.142000-01-10 0.000117787  0.010537636 0.000033700      1573  34191.50           SPX2.highlow SPX2.highopen SPX2.openprice SPX2.closeprice2000-01-03   0.02718625   0.005937756        1469.25         1454.482000-01-04   0.04052226   0.000000000        1455.22         1399.152000-01-05  -0.02550524   0.009848303        1399.42         1401.872000-01-06  -0.01418039   0.006958070        1402.11         1403.602000-01-07  -0.02806616   0.026126203        1403.45         1440.452000-01-10  -0.01575486   0.015754861        1441.47         1456.74                 DATE   SPX2.rvol2000-01-03 2000-01-03 0.0125395372000-01-04 2000-01-04 0.0172669342000-01-05 2000-01-05 0.0175278642000-01-06 2000-01-06 0.0116721032000-01-07 2000-01-07 0.0096280842000-01-10 2000-01-10 0.010852972

SPXdata$SPX2.rv 是预计的理论方差。 SPXdata$SPX2.r 是每日收益(平仓)。 SPXdata$SPX2.rvol 是预计的理论稳定率

 SPXdata$SPX2.rvol

基准模型:SPX每日收益率建模

ARMA-EGARCH

思考到在条件方差中具备异方差性的每日收益,GARCH模型能够作为拟合和预测的基准。

首先,收益序列是安稳的。

 Augmented Dickey-Fuller Testdata:  SPXdata$SPX2.rDickey-Fuller = -15.869, Lag order = 16, p-value = 0.01alternative hypothesis: stationary

散布显示出尖峰和厚尾。能够通过t散布回归散布密度图来近似  。黑线是内核平滑的密度,绿线是t散布密度。

acf(SPXdata$SPX2.r)  ##自相关系数图

 Box-Ljung testdata:  SPXdata$SPX2.rX-squared = 26.096, df = 1, p-value = 3.249e-07

自相干图显示了每周相关性。Ljung-Box测试确认了序列存在相关性。

Series: SPXdata$SPX2.r ARIMA(2,0,0) with zero meanCoefficients:          ar1      ar2      -0.0839  -0.0633s.e.   0.0154   0.0154sigma^2 estimated as 0.0001412:  log likelihood=12624.97AIC=-25243.94   AICc=-25243.93   BIC=-25224.92

auro.arima 示意ARIMA(2,0,0)能够对收益序列中的自相干进行建模,而eGARCH(1,1)在稳定率建模中很受欢迎。因而,我抉择具备t散布的ARMA(2,0)-eGARCH(1,1)作为基准模型。

 *---------------------------------**       GARCH Model Spec          **---------------------------------*Conditional Variance Dynamics------------------------------------GARCH Model     : eGARCH(1,1)Variance Targeting  : FALSE Conditional Mean Dynamics------------------------------------Mean Model      : ARFIMA(2,0,0)Include Mean        : TRUE GARCH-in-Mean       : FALSE Conditional Distribution------------------------------------Distribution    :  std Includes Skew   :  FALSE Includes Shape  :  TRUE Includes Lambda :  FALSE

我用4189个观测值进行了回测(从2000-01-03到2016-10-06),应用前1000个观测值训练模型,而后每次向前滚动预测一个,而后每5个观测值从新预计模型一次 。下图显示 了样本外  预测和相应的理论稳定率。

预测显示与实现稳定率高度相干,超过72%。

cor(egarch_model$roll.pred$realized_vol, egarch_model$roll.pred$egarch.predicted_vol,     method = "spearman")

[1] 0.7228007

误差摘要和绘图

 Min.    1st Qu.     Median       Mean    3rd Qu.       Max. -0.0223800 -0.0027880 -0.0013160 -0.0009501  0.0003131  0.0477600

平均误差平方(MSE):

[1] 1.351901e-05

改良:理论GARCH模型和LRD建模

理论GARCH

realGARCH 该模型由  Hansen,Huang和Shek(2012)  (HHS2012)提出,该模型 应用非对称动力学示意将理论(已实现)稳定率测度与潜在  \_实在稳定率分割\_起来。与规范GARCH模型不同,它是收益和理论稳定率度量的联结建模(本文中的HEAVY预计器)。

模型:

 *---------------------------------**       GARCH Model Spec          **---------------------------------*Conditional Variance Dynamics------------------------------------GARCH Model     : realGARCH(2,1)Variance Targeting  : FALSE Conditional Mean Dynamics------------------------------------Mean Model      : ARFIMA(2,0,0)Include Mean        : TRUE GARCH-in-Mean       : FALSE Conditional Distribution------------------------------------Distribution    :  norm Includes Skew   :  FALSE Includes Shape  :  FALSE Includes Lambda :  FALSE

滚动预测过程与上述ARMA-EGARCH模型雷同。下图显示  了样本外  预测和相应的理论稳定率。

预测与理论的相关性超过77%

cor(arfima_egarch_model$roll.pred$realized_vol, arfima_egarch_model$roll.pred$arfima_egarch.predicted_vol,     method = "spearman")

[1] 0.7707991

误差摘要和图:

 Min.    1st Qu.     Median       Mean    3rd Qu.       Max. -1.851e-02 -1.665e-03 -4.912e-04 -1.828e-05  9.482e-04  5.462e-02

均方误差(MSE):

[1] 1.18308e-05

备注:

  • 用于每日收益序列的ARMA-eGARCH模型和用于理论稳定率的ARFIMA-eGARCH模型利用不同的信息源。ARMA-eGARCH模型仅波及每日收益,而ARFIMA-eGARCH模型基于HEAVY估算器,该估算器是依据日内数据计算得出的。RealGARCH模型将它们联合在一起。
  • 以均方误差掂量,ARFIMA-eGARCH模型的性能略优于realGARCH模型。这可能是因为ARFIMA-eGARCH模型的LRD个性所致。

集成模型

随机森林

当初曾经建设了三个预测

  • ARMA egarch_model
  • realGARCH rgarch model
  • ARFIMA-eGARCH arfima_egarch_model

只管这三个预测显示出很高的相关性,但预计模型平均值会缩小预测方差,从而进步准确性。应用了随机森林集成。

varImpPlot(rf$model)

随机森林由500棵树组成,每棵树随机抉择2个预测以拟合理论值。下图是拟合和理论稳定率。

预测与理论稳定率的相关性:

[1] 0.840792

误差图:

均方误差:

[1] 1.197388e-05

MSE与理论稳定率方差的比率

[1] 0.2983654

备注

波及已理论量度信息的realGARCH模型和ARFIMA-eGARCH模型优于规范的收益序列ARMA-eGARCH模型。与基准相比,随机森林集成的MSE缩小了17%以上。

从信息源的角度来看,realGARCH模型和ARFIMA-eGARCH模型捕捉了日内高频数据中的增量信息(通过模型,HEAVY理论稳定率估算)

进一步钻研:隐含稳定率

以上办法不蕴含隐含稳定率数据。隐含稳定率是依据SPX期权计算得出的。天然的认识是将隐含稳定率作为预测已实现稳定率的预测因子。然而,大量钻研表明,无模型的隐含稳定率VIX是有偏估计量,不如基于过来理论稳定率的预测无效。 Torben G. Andersen,Per Frederiksen和Arne D. Staal(2007)  批准这种观点。他们的工作表明,将隐含稳定率引入工夫序列剖析框架不会带来任何显著的益处。然而,作者指出了隐含稳定率中增量信息的可能性,并提出了组合模型。

因而,进一步的倒退可能是将工夫序列预测和隐含稳定率(如果存在)的预测信息相结合的集成模型。

    • -

最受欢迎的见解

1.HAR-RV-J与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频稳定率

2.R语言中基于混合数据抽样(MIDAS)回归的HAR-RV模型预测GDP增长

3.稳定率的实现:ARCH模型与HAR-RV模型

4.R语言ARMA-EGARCH模型、集成预测算法对SPX理论稳定率进行预测

5.GARCH(1,1),MA以及历史模拟法的VaR比拟

6.R语言多元COPULA GARCH 模型工夫序列预测

7.R语言基于ARMA-GARCH过程的VAR拟合和预测

8.matlab预测ARMA-GARCH 条件均值和方差模型

9.R语言对S&P500股票指数进行ARIMA + GARCH交易策略