关于数据挖掘:R语言中基于混合数据抽样MIDAS回归的HARRV模型预测GDP增长附代码数据

43次阅读

共计 5599 个字符,预计需要花费 14 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=12292

最近咱们被客户要求撰写对于 HAR-RV 的钻研报告,包含一些图形和统计输入。

咱们复制了 Ghysels(2013)中提供的示例。咱们进行了 MIDAS 回归剖析,来预测季度 GDP 增长以及每月非农就业人数的增长

预测 GDP 增长

预测公式如下

其中 yt 是按季度季节性调整后的理论 GDP 的对数增长,x3t 是月度总待业非农业工资的对数增长。

首先,咱们加载数据并执行转换。

R> y <- window(USqgdp, end = c(2011, 2))
R> x <- window(USpayems, end = c(2011, 7))
R> yg <- diff(log(y)) * 100
R> xg <- diff(log(x)) * 100

最初两行用于平衡样本大小,样本大小在原始数据中有所不同。咱们只需在数据的结尾和结尾增加其余 NA 值即可。数据的图形示意如图所示。要指定 midas_r 函数的模型,咱们以下等效模式重写它:


点击题目查阅往期内容

R 语言预测期货稳定率的实现:ARCH 与 HAR-RV 与 GARCH,ARFIMA 模型比拟

左右滑动查看更多

01

02

03

04

就像在 Ghysels(2013)中一样,咱们将估算样本限度在 1985 年第一季度到 2009 年第一季度之间。咱们应用 Beta 多项式,非零 Beta 和 U -MIDAS 权重来评估模型。

R> coef(beta0)
(Intercept) yy xx1 xx2 xx3
0.8315274 0.1058910 2.5887103 1.0201202 13.6867809

R> coef(betan)
(Intercept) yy xx1 xx2 xx3 xx4
0.93778705 0.06748141 2.26970646 0.98659174 1.49616336 -0.09184983

(Intercept) yy xx1 xx2 xx3 xx4
0.92989757 0.08358393 2.00047205 0.88134597 0.42964662 -0.17596814
xx5 xx6 xx7 xx8 xx9
0.28351010 1.16285271 -0.53081967 -0.73391876 -1.18732001

咱们能够应用 2009 年第 2 季度至 2011 年第 2 季度蕴含 9 个季度的样本数据评估这三个模型的预测性能。

R> fulldata <- list(xx = window(nx, start = c(1985, 1), end = c(2011, 6)),
+ yy = window(ny, start = c(1985, 1), end = c(2011, 2)))
R> insample <- 1:length(yy)
R> outsample <- (1:length(fulldata$yy))[-insample]
R> avgf <- average_forecast(list(beta0, betan, um), data = fulldata,
+ insample = insample, outsample = outsample)
R> sqrt(avgf$accuracy$individual$MSE.out.of.sample)
[1] 0.5361953 0.4766972 0.4457144

咱们看到,MIDAS 回归模型提供了最佳的样本外 RMSE。

预测理论稳定

作为另一个演示,咱们应用 midasr 来预测每日实现的稳定率。Corsi(2009)提出了一个简略的预测每日理论稳定率的模型。实现稳定率的异质自回归模型(HAR-RV)定义为

咱们假如一周有 5 天,一个月有 4 周。该模型是 MIDAS 回归的特例:

为了进行教训论证,咱们应用了由 Heber,Lunde,Shephard 和 Sheppard(2009)提供的对于股票指数的已实现稳定数据。咱们基于 5 分钟的收益数据估算 S&P500 指数的年度实现稳定率模型。

 Parameters:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.83041 0.36437 2.279 0.022726 *
rv1 0.34066 0.04463 7.633 2.95e-14 ***
rv2 0.41135 0.06932 5.934 3.25e-09 ***
rv3 0.19317 0.05081 3.802 0.000146 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5.563 on 3435 degrees of freedom

为了进行比拟,咱们还应用归一化指数 Almon 权重来预计模型

 Parameters:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.837660 0.377536 2.219 0.0266 *
rv1 0.944719 0.027748 34.046 < 2e-16 ***
rv2 -0.768296 0.096120 -7.993 1.78e-15 ***
rv3 0.029084 0.005604 5.190 2.23e-07 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5.535 on 3435 degrees of freedom

咱们能够应用异方差性和自相干鲁棒权重标准测验 hAhr_test 来测验这些限度中哪些与数据兼容。

 hAh restriction test (robust version)
data:
hAhr = 28.074, df = 17, p-value = 0.04408
 
hAh restriction test (robust version)
data:
hAhr = 19.271, df = 17, p-value = 0.3132

咱们能够看到,与 MIDAS 回归模型中的 HAR-RV 隐含束缚无关的零假如在 0.05 的显着性程度上被回绝,而指数 Almon 滞后束缚的零假如则不能被回绝。

图阐明了拟合的 MIDAS 回归系数和 U -MIDAS 回归系数及其相应的 95%置信区间。对于指数 Almon 滞后指标,咱们能够通过 AIC 或 BIC 抉择滞后次数。

咱们应用了两种优化办法来进步收敛性。将测试函数利用于每个候选模型。函数 hAhr_test 须要大量的计算工夫,尤其是对于滞后阶数较大的模型,因而咱们仅在第二步进行计算,并且限度了滞后 restriction test 的抉择。AIC 抉择模型有 9 阶滞后:

 Selected model with AIC = 21551.97
Based on restricted MIDAS regression model
The p-value for the null hypothesis of the test hAhr_test is 0.5531733
 Parameters:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.96102 0.36944 2.601 0.00933 **
rv1 0.93707 0.02729 34.337 < 2e-16 ***
rv2 -1.19233 0.19288 -6.182 7.08e-10 ***
rv3 0.09657 0.02190 4.411 1.06e-05 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5.524 on 3440 degrees of freedom

hAh_test 的 HAC 再次无奈回绝指数 Almon 滞后的原假如。咱们能够应用具备 1000 个观测值窗口的滚动预测来钻研两个模型的预测性能。为了进行比拟,咱们还计算了无限度 AR(20)模型的预测。

 Model MSE.out.of.sample MAPE.out.of.sample
1 rv ~  (rv, 1:20, 1) 10.82516 26.60201
2 rv ~  (rv, 1:20, 1, harstep) 10.45842 25.93013
3 rv ~  (rv, 1:9, 1, nealmon) 10.34797 25.90268
MASE.out.of.sample MSE.in.sample MAPE.in.sample MASE.in.sample
1 0.8199566 28.61602 21.56704 0.8333858
2 0.8019687 29.24989 21.59220 0.8367377
3 0.7945121 29.08284 21.81484 0.8401646

咱们看到指数 Almon 滞后模型略优于 HAR-RV 模型,并且两个模型均优于 AR(20)模型。

参考文献

Andreou E,Ghysels E,Kourtellos A(2010)。“具备混合采样频率的回归模型。”计量经济学杂志,158,246–261。doi:10.1016 / j.jeconom.2010.01。004。

Andreou E,Ghysels E,Kourtellos A(2011)。“混合频率数据的预测。”在 MP Clements 中,DF Hendry(编),《牛津经济预测手册》,第 225–245 页。


点击文末 “浏览原文”

获取全文残缺材料。

本文选自《 R 语言中基于混合数据抽样 (MIDAS) 回归的 HAR-RV 模型预测 GDP 增长》。

点击题目查阅往期内容

HAR-RV- J 与递归神经网络(RNN)混合模型预测和交易大型股票指数的高频稳定率
R 语言预测期货稳定率的实现:ARCH 与 HAR-RV 与 GARCH,ARFIMA 模型比拟
PYTHON 用 GARCH、离散随机稳定率模型 DSV 模仿预计股票收益工夫序列与蒙特卡洛可视化
极值实践 EVT、POT 超阈值、GARCH 模型剖析股票指数 VaR、条件 CVaR:多元化投资组合预测危险测度剖析
Garch 稳定率预测的区制转移交易策略
金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言危险价值:ARIMA,GARCH,Delta-normal 法滚动预计 VaR(Value at Risk)和回测剖析股票数据
R 语言 GARCH 建模罕用软件包比拟、拟合规范普尔 SP 500 指数稳定率工夫序列和预测可视化
Python 金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
MATLAB 用 GARCH 模型对股票市场收益率工夫序列稳定的拟合与预测 R 语言 GARCH-DCC 模型和 DCC(MVT)建模预计
Python 用 ARIMA、GARCH 模型预测剖析股票市场收益率工夫序列
R 语言中的工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言 ARIMA-GARCH 稳定率模型预测股票市场苹果公司日收益率工夫序列
Python 应用 GARCH,EGARCH,GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
R 语言工夫序列 GARCH 模型剖析股市稳定率
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
Python 应用 GARCH,EGARCH,GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
应用 R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略
R 语言用多元 ARMA,GARCH ,EWMA, ETS, 随机稳定率 SV 模型对金融工夫序列数据建模
R 语言股票市场指数:ARMA-GARCH 模型和对数收益率数据探索性剖析
R 语言多元 Copula GARCH 模型工夫序列预测
R 语言应用多元 AR-GARCH 模型掂量市场危险
R 语言中的工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言用 Garch 模型和回归模型对股票价格剖析
GARCH(1,1),MA 以及历史模拟法的 VaR 比拟
matlab 预计 arma garch 条件均值和方差模型 R 语言 POT 超阈值模型和极值实践 EVT 剖析
R 语言极值推断:狭义帕累托散布 GPD 应用极大似然预计、轮廓似然预计、Delta 法
R 语言极值实践 EVT:基于 GPD 模型的火灾损失散布剖析
R 语言有极值(EVT)依赖构造的马尔可夫链 (MC) 对洪水极值剖析
R 语言 POT 超阈值模型和极值实践 EVT 剖析
R 语言混合正态分布极大似然预计和 EM 算法
R 语言多项式线性模型:最大似然预计二次曲线
R 语言 Wald 测验 vs 似然比测验
R 语言 GARCH-DCC 模型和 DCC(MVT)建模预计
R 语言非参数办法:应用核回归平滑预计和 K -NN(K 近邻算法)分类预测心脏病数据
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
R 语言基于 Bootstrap 的线性回归预测置信区间预计办法
R 语言随机搜寻变量抉择 SSVS 预计贝叶斯向量自回归(BVAR)模型
Matlab 马尔可夫链蒙特卡罗法(MCMC)预计随机稳定率(SV,Stochastic Volatility)模型
Matlab 马尔可夫区制转换动静回归模型预计 GDP 增长率 R 语言极值推断:狭义帕累托散布 GPD 应用极大似然预计、轮廓似然预计、Delta 法

正文完
 0