原文链接:http://tecdat.cn/?p=12174
-
- –
介绍
本文比拟了几个工夫序列模型,以预测 SP500 指数的每日 理论稳定率。基准是 SPX 日收益序列的 ARMA-EGARCH 模型。将其与 GARCH 模型进行比拟。最初,提出了汇合预测算法。
假如条件
理论稳定率是看不见的,因而咱们只能对其进行估算。这也是稳定率建模的难点。如果实在值未知,则很难判断预测品质。尽管如此,钻研人员为理论稳定率开发了估算 模型 。Andersen,Bollerslev Diebold(2008)和 Barndorff-Nielsen and Shephard(2007)以及 Shephard and Sheppard(2009)提出了一类基于高频的稳定率(HEAVY)模型,作者认为 HEAVY 模型给出了 很好的 预计。
假如:HEAVY 实现的稳定率估算器无偏且无效。
在下文中,将 HEAVY 估计量作为 察看到的 已实现稳定率(理论稳定率)来确定预测性能。
数据起源
- SPX 每日数据(平仓收益)
- SPX 盘中高频数据(HEAVY 模型预计)
- VIX
- VIX 衍生品(VIX 期货)
在本文中,我次要关注前两个。
数据采集
理论稳定率预计和每日收益
我实现了 Shephard 和 Sheppard 的模型,并预计了 SPX 的 理论量。
head(SPXdata)
SPX2.rv SPX2.r SPX2.rs SPX2.nobs SPX2.open
2000-01-03 0.000157240 -0.010103618 0.000099500 1554 34191.16
2000-01-04 0.000298147 -0.039292183 0.000254283 1564 34195.04
2000-01-05 0.000307226 0.001749195 0.000138133 1552 34196.70
2000-01-06 0.000136238 0.001062120 0.000062000 1561 34191.43
2000-01-07 0.000092700 0.026022074 0.000024100 1540 34186.14
2000-01-10 0.000117787 0.010537636 0.000033700 1573 34191.50
SPX2.highlow SPX2.highopen SPX2.openprice SPX2.closeprice
2000-01-03 0.02718625 0.005937756 1469.25 1454.48
2000-01-04 0.04052226 0.000000000 1455.22 1399.15
2000-01-05 -0.02550524 0.009848303 1399.42 1401.87
2000-01-06 -0.01418039 0.006958070 1402.11 1403.60
2000-01-07 -0.02806616 0.026126203 1403.45 1440.45
2000-01-10 -0.01575486 0.015754861 1441.47 1456.74
DATE SPX2.rvol
2000-01-03 2000-01-03 0.012539537
2000-01-04 2000-01-04 0.017266934
2000-01-05 2000-01-05 0.017527864
2000-01-06 2000-01-06 0.011672103
2000-01-07 2000-01-07 0.009628084
2000-01-10 2000-01-10 0.010852972
SPXdata$SPX2.rv
是预计的理论方差。SPXdata$SPX2.r
是每日收益(平仓)。SPXdata$SPX2.rvol
是预计的理论稳定率
SPXdata$SPX2.rvol
基准模型:SPX 每日收益率建模
ARMA-EGARCH
思考到在条件方差中具备异方差性的每日收益,GARCH 模型能够作为拟合和预测的基准。
首先,收益序列是安稳的。
Augmented Dickey-Fuller Test
data: SPXdata$SPX2.r
Dickey-Fuller = -15.869, Lag order = 16, p-value = 0.01
alternative hypothesis: stationary
散布显示出尖峰和厚尾。能够通过 t 散布回归散布密度图来近似。黑线是内核平滑的密度,绿线是 t 散布密度。
acf(SPXdata$SPX2.r) ## 自相关系数图
Box-Ljung test
data: SPXdata$SPX2.r
X-squared = 26.096, df = 1, p-value = 3.249e-07
自相干图显示了每周相关性。Ljung-Box 测试确认了序列存在相关性。
Series: SPXdata$SPX2.r
ARIMA(2,0,0) with zero mean
Coefficients:
ar1 ar2
-0.0839 -0.0633
s.e. 0.0154 0.0154
sigma^2 estimated as 0.0001412: log likelihood=12624.97
AIC=-25243.94 AICc=-25243.93 BIC=-25224.92
auro.arima
示意 ARIMA(2,0,0)能够对收益序列中的自相干进行建模,而 eGARCH(1,1)在稳定率建模中很受欢迎。因而,我抉择具备 t 散布的 ARMA(2,0)-eGARCH(1,1)作为基准模型。
*---------------------------------*
* GARCH Model Spec *
*---------------------------------*
Conditional Variance Dynamics
------------------------------------
GARCH Model : eGARCH(1,1)
Variance Targeting : FALSE
Conditional Mean Dynamics
------------------------------------
Mean Model : ARFIMA(2,0,0)
Include Mean : TRUE
GARCH-in-Mean : FALSE
Conditional Distribution
------------------------------------
Distribution : std
Includes Skew : FALSE
Includes Shape : TRUE
Includes Lambda : FALSE
我用 4189 个观测值进行了回测(从 2000-01-03 到 2016-10-06),应用前 1000 个观测值训练模型,而后每次向前滚动预测一个,而后每 5 个观测值从新预计模型一次。下图显示 了样本外 预测和相应的理论稳定率。
预测显示与实现稳定率高度相干,超过 72%。
cor(egarch_model$roll.pred$realized_vol, egarch_model$roll.pred$egarch.predicted_vol,
method = "spearman")
[1] 0.7228007
误差摘要和绘图
Min. 1st Qu. Median Mean 3rd Qu. Max.
-0.0223800 -0.0027880 -0.0013160 -0.0009501 0.0003131 0.0477600
平均误差平方(MSE):
[1] 1.351901e-05
改良:理论 GARCH 模型和 LRD 建模
理论 GARCH
realGARCH
该模型由 Hansen,Huang 和 Shek(2012)(HHS2012)提出,该模型 应用非对称动力学示意将理论(已实现)稳定率测度与潜在 \_实在稳定率分割 \_起来。与规范 GARCH 模型不同,它是收益和理论稳定率度量的联结建模(本文中的 HEAVY 预计器)。
模型:
*---------------------------------*
* GARCH Model Spec *
*---------------------------------*
Conditional Variance Dynamics
------------------------------------
GARCH Model : realGARCH(2,1)
Variance Targeting : FALSE
Conditional Mean Dynamics
------------------------------------
Mean Model : ARFIMA(2,0,0)
Include Mean : TRUE
GARCH-in-Mean : FALSE
Conditional Distribution
------------------------------------
Distribution : norm
Includes Skew : FALSE
Includes Shape : FALSE
Includes Lambda : FALSE
滚动预测过程与上述 ARMA-EGARCH 模型雷同。下图显示 了样本外 预测和相应的理论稳定率。
预测与理论的相关性超过 77%
cor(arfima_egarch_model$roll.pred$realized_vol, arfima_egarch_model$roll.pred$arfima_egarch.predicted_vol,
method = "spearman")
[1] 0.7707991
误差摘要和图:
Min. 1st Qu. Median Mean 3rd Qu. Max.
-1.851e-02 -1.665e-03 -4.912e-04 -1.828e-05 9.482e-04 5.462e-02
均方误差(MSE):
[1] 1.18308e-05
备注:
- 用于每日收益序列的 ARMA-eGARCH 模型和用于理论稳定率的 ARFIMA-eGARCH 模型利用不同的信息源。ARMA-eGARCH 模型仅波及每日收益,而 ARFIMA-eGARCH 模型基于 HEAVY 估算器,该估算器是依据日内数据计算得出的。RealGARCH 模型将它们联合在一起。
- 以均方误差掂量,ARFIMA-eGARCH 模型的性能略优于 realGARCH 模型。这可能是因为 ARFIMA-eGARCH 模型的 LRD 个性所致。
集成模型
随机森林
当初曾经建设了三个预测
- ARMA
egarch_model
- realGARCH
rgarch model
- ARFIMA-eGARCH
arfima_egarch_model
只管这三个预测显示出很高的相关性,但预计模型平均值会缩小预测方差,从而进步准确性。应用了随机森林集成。
varImpPlot(rf$model)
随机森林由 500 棵树组成,每棵树随机抉择 2 个预测以 拟合 理论值。下图是拟合和理论稳定率。
预测与理论稳定率的相关性:
[1] 0.840792
误差图:
均方误差:
[1] 1.197388e-05
MSE 与理论稳定率方差的比率
[1] 0.2983654
备注
波及已理论量度信息的 realGARCH 模型和 ARFIMA-eGARCH 模型优于规范的收益序列 ARMA-eGARCH 模型。与基准相比,随机森林集成的 MSE 缩小了 17%以上。
从信息源的角度来看,realGARCH 模型和 ARFIMA-eGARCH 模型捕捉了日内高频数据中的增量信息(通过模型,HEAVY 理论稳定率估算)
进一步钻研:隐含稳定率
以上办法不蕴含隐含稳定率数据。隐含稳定率是依据 SPX 期权计算得出的。天然的认识是将隐含稳定率作为预测已实现稳定率的预测因子。然而,大量钻研表明,无模型的隐含稳定率 VIX 是有偏估计量,不如基于过来理论稳定率的预测无效。Torben G. Andersen,Per Frederiksen 和 Arne D. Staal(2007)批准这种观点。他们的工作表明,将隐含稳定率引入工夫序列剖析框架不会带来任何显著的益处。然而,作者指出了隐含稳定率中增量信息的可能性,并提出了组合模型。
因而,进一步的倒退可能是将工夫序列预测和隐含稳定率(如果存在)的预测信息相结合的集成模型。
-
- –
最受欢迎的见解
1.HAR-RV- J 与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频稳定率
2. R 语言中基于混合数据抽样 (MIDAS) 回归的 HAR-RV 模型预测 GDP 增长
3.稳定率的实现:ARCH 模型与 HAR-RV 模型
4. R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
5.GARCH(1,1),MA 以及历史模拟法的 VaR 比拟
6. R 语言多元 COPULA GARCH 模型工夫序列预测
7. R 语言基于 ARMA-GARCH 过程的 VAR 拟合和预测
8.matlab 预测 ARMA-GARCH 条件均值和方差模型
9. R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略