关于算法:R语言用LASSOadaptive-LASSO预测通货膨胀时间序列

7次阅读

共计 1770 个字符,预计需要花费 5 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=22273 

动机

如果你理解数据迷信畛域,你可能据说过 LASSO。LASSO 是一个对指标函数中的参数大小进行惩办的模型,试图将不相干的变量从模型中排除。它有两个十分天然的用处,第一个是变量抉择,第二个是预测。因为通常状况下,LASSO 抉择的变量会比一般最小二乘法(OLS)少得多,其预测的方差会小得多,代价是样本中呈现大量的偏差。

LASSO 最重要的特点之一是它能够解决比观测值多得多的变量,我说的是成千上万的变量。这是它最近风行的次要起因之一。

实例

在这个例子中,我应用最风行的 LASSO,glmnet。咱们能够十分疾速地预计 LASSO,并应用穿插验证抉择最佳模型。依据我的教训,在工夫序列的背景下,应用信息准则(如 BIC)来抉择最佳模型会更好。它更快,并防止了工夫序列中穿插验证的一些简单问题。

本文预计 LASSO,并应用信息规范来抉择最佳模型。咱们将应用 LASSO 来预测通货膨胀。

## == 数据分解成样本内和样本外
y.in=y\[1:100\]; y.out=y\[-c(1:100)\]
x.in=x\[1:100,\]; x.out=x\[-c(1:100),\]

## == LASSO == ##
glmnet(x.in,y.in,crit = "bic")

plot(lasso)

下面的第一个图显示,当咱们减少 LASSO 指标函数中的惩办时,变量会归零。第二张图显示了 BIC 曲线和选定的模型。当初咱们能够计算预测了。

## == 预测 == ##
predict(lasso,x.out)

adaptive LASSO

LASSO 有一个自适应版本,在变量抉择方面有一些更好的个性。请留神,这并不总是意味着更好的预测。该模型背地的想法是应用一些以前晓得的信息来更无效地抉择变量。一般来说,这些信息是由 LASSO 或其余一些模型预计的系数。

## = adaLASSO = ##

adalasso(x.in,y.in,crit="bic",penalty=factor)
predict(adalasso, x.out)

## = 比拟误差 = ##
sqrt(mean((y.out-pred.ada)^2)

在这种状况下,adaLASSO 产生了一个更准确的预测。一般来说,adaLASSO 比简略的 LASSO 的预测成果更好。然而,这不是一个相对的事实。我见过很多简略 LASSO 做得更好的案例。

参考文献

[1] Bühlmann, Peter, and Sara Van De Geer. Statistics for high-dimensional data: methods, theory and applications. Springer Science & Business Media, 2011.

[2] Jerome Friedman, Trevor Hastie, Robert Tibshirani (2010). Regularization Paths for
Generalized Linear Models via Coordinate Descent. Journal of Statistical Software, 33(1), 1-22. URL http://www.jstatsoft.org/v33/i01/

[3] Marcio Garcia, Marcelo C. Medeiros , Gabriel F. R. Vasconcelos (2017). Real-time inflation forecasting with high-dimensional models: The case of Brazil. Internationnal Journal of Forecasting, in press.


最受欢迎的见解

1. 在 python 中应用 lstm 和 pytorch 进行工夫序列预测

2.python 中利用长短期记忆模型 lstm 进行工夫序列预测剖析

3. 应用 r 语言进行工夫序列(arima,指数平滑)剖析

4.r 语言多元 copula-garch- 模型工夫序列预测

5.r 语言 copulas 和金融工夫序列案例

6. 应用 r 语言随机稳定模型 sv 解决工夫序列中的随机稳定

7.r 语言工夫序列 tar 阈值自回归模型

8.r 语言 k -shape 工夫序列聚类办法对股票价格工夫序列聚类

9.python3 用 arima 模型进行工夫序列预测

正文完
 0