关于数据挖掘:ARIMA模型ARIMAX模型预测冰淇淋消费时间序列数据附代码数据

123次阅读

共计 3034 个字符,预计需要花费 8 分钟才能阅读完成。

全文下载链接:http://tecdat.cn/?p=22511

最近咱们被客户要求撰写对于 ARIMAX 的钻研报告,包含一些图形和统计输入。

规范的 ARIMA(挪动均匀自回归模型)模型容许只依据预测变量的过来值进行预测。

该模型假设一个变量的将来的值线性地取决于其过来的值,以及过来(随机)影响的值。ARIMAX 模型是 ARIMA 模型的一个扩大版本。它还包含其余独立(预测)变量。该模型也被称为向量 ARIMA 或动静回归模型。

ARIMAX 模型相似于多变量回归模型,但容许利用回归残差中可能存在的自相干来进步预测的准确性。
本文提供了一个进行 ARIMAX 模型预测的练习。还查看了回归系数的统计学意义。

这些练习应用了冰淇淋生产数据。该数据集蕴含以下变量。

  • 冰淇淋生产(人均)
  • 每周的均匀家庭收入
  • 冰淇淋的价格
  • 平均温度。

观测数据的数量为 30 个。它们对应的是 1951 年 3 月 18 日至 1953 年 7 月 11 日这一时间段内的周围工夫。

练习 1

加载数据集,并绘制变量 cons(冰淇淋生产)、temp(温度)和支出。

 ggplot(df, aes(x = X, y = income)) +
  ylab("支出") +
  xlab("工夫") +

grid.arrange(p1, p2, p3, ncol=1, nrow=3)


点击题目查阅往期内容

R 语言应用 ARIMAX 预测失业率经济工夫序列数据

左右滑动查看更多

01

02

03

04

练习 2 

对冰淇淋生产数据预计 ARIMA 模型。而后将该模型作为输出传给预测函数,失去将来 6 个期间的预测数据。

auto.arima(cons)

fcast_cons <- forecast(fit_cons, h = 6)

练习 3

绘制失去的预测图。


点击题目查阅往期内容

[](http://mp.weixin.qq.com/s?__biz=MzU4NTA1MDk4MA==&mid=22474964…)Python 中的 ARIMA 模型、SARIMA 模型和 SARIMAX 模型对工夫序列预测

左右滑动查看更多

01

02

03

04

练习 4

找出拟合的 ARIMA 模型的均匀绝对误差(MASE)。

accuracy

练习 5

为生产数据预计一个扩大的 ARIMA 模型,将温度变量作为一个额定的回归因子(应用 auto.arima 函数)。而后对将来 6 个期间进行预测(留神这个预测须要对冀望温度进行假如;假如将来 6 个期间的温度将由以下向量示意:

fcast_temp <- c(70.5, 66, 60.5, 45.5, 36, 28))

绘制取得的预测图。

练习 6

输入取得的预测摘要。找出温度变量的系数,它的标准误差,以及预测的 MASE。将 MASE 与初始预测的 MASE 进行比拟。

summary(fca)

温度变量的系数是 0.0028

该系数的标准误差为 0.0007

均匀相对比例误差为 0.7354048,小于初始模型的误差(0.8200619)。

练习 7

查看温度变量系数的统计意义。该系数在 5% 的程度上是否有统计学意义?

test(fit)

练习 8

预计 ARIMA 模型的函数能够输出更多的附加回归因子,但只能以矩阵的模式输出。创立一个有以下几列的矩阵。

温度变量的值。
支出变量的值。
滞后一期的支出变量的值。
滞后两期的支出变量的值。
输入该矩阵。
留神:最初三列能够通过在支出变量值的向量中增加两个 NA 来创立,并将失去的向量作为嵌入函数的输出(维度参数等于要创立的列数)。

vars <- cbind(temp, income)
print(vars)

练习 9

应用取得的矩阵来拟合三个扩大的 ARIMA 模型,应用以下变量作为额定的回归因子。

温度、支出。
温度、支出的滞后期为 0、1。
温度,滞后期为 0、1、2 的支出。
查看每个模型的摘要,并找到信息准则(AIC)值最低的模型。
留神 AIC 不能用于比拟具备不同阶数的 ARIMA 模型,因为察看值的数量不同。例如,非差分模型 ARIMA(p,0,q)的 AIC 值不能与差分模型 ARIMA(p,1,q)的相应值进行比拟。

auto.arima(cons, xreg = var)
print(fit0$aic)

能够应用 AIC,因为各模型的参数阶数雷同(0)。

AIC 值最低的模型是第一个模型。

它的 AIC 等于 -113.3。

练习 10

应用上一练习中发现的模型对将来 6 个期间进行预测,并绘制预测图。预测须要一个将来 6 个期间的冀望温度和支出的矩阵;应用 temp 变量和以下冀望支出值创立矩阵:91, 91, 93, 96, 96, 96。
找出该模型的均匀相对比例误差,并与本练习集中前两个模型的误差进行比拟。

带有两个内部回归因子的模型具备最低的 均匀相对比例误差(0.528)


本文摘选 《R 语言 ARIMA 模型,ARIMAX 模型预测冰淇淋生产工夫序列数据 ,点击“ 浏览原文”获取全文残缺材料。

点击题目查阅往期内容

工夫序列剖析:ARIMA GARCH 模型剖析股票价格数据
多元工夫序列滚动预测:ARIMA、回归、ARIMAX 模型剖析
【视频】工夫序列剖析:ARIMA-ARCH / GARCH 模型剖析股票价格
工夫序列 GARCH 模型剖析股市稳定率
PYTHON 用 GARCH、离散随机稳定率模型 DSV 模仿预计股票收益工夫序列与蒙特卡洛可视化
极值实践 EVT、POT 超阈值、GARCH 模型剖析股票指数 VaR、条件 CVaR:多元化投资组合预测危险测度剖析
Garch 稳定率预测的区制转移交易策略
金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言危险价值:ARIMA,GARCH,Delta-normal 法滚动预计 VaR(Value at Risk)和回测剖析股票数据
R 语言 GARCH 建模罕用软件包比拟、拟合规范普尔 SP 500 指数稳定率工夫序列和预测可视化
Python 金融工夫序列模型 ARIMA 和 GARCH 在股票市场预测利用
MATLAB 用 GARCH 模型对股票市场收益率工夫序列稳定的拟合与预测 R 语言 GARCH-DCC 模型和 DCC(MVT)建模预计
Python 用 ARIMA、GARCH 模型预测剖析股票市场收益率工夫序列
R 语言中的工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言 ARIMA-GARCH 稳定率模型预测股票市场苹果公司日收益率工夫序列
Python 应用 GARCH,EGARCH,GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
R 语言工夫序列 GARCH 模型剖析股市稳定率
R 语言 ARMA-EGARCH 模型、集成预测算法对 SPX 理论稳定率进行预测
matlab 实现 MCMC 的马尔可夫转换 ARMA – GARCH 模型预计
Python 应用 GARCH,EGARCH,GJR-GARCH 模型和蒙特卡洛模仿进行股价预测
应用 R 语言对 S&P500 股票指数进行 ARIMA + GARCH 交易策略
R 语言用多元 ARMA,GARCH ,EWMA, ETS, 随机稳定率 SV 模型对金融工夫序列数据建模
R 语言股票市场指数:ARMA-GARCH 模型和对数收益率数据探索性剖析
R 语言多元 Copula GARCH 模型工夫序列预测
R 语言应用多元 AR-GARCH 模型掂量市场危险
R 语言中的工夫序列分析模型:ARIMA-ARCH / GARCH 模型剖析股票价格
R 语言用 Garch 模型和回归模型对股票价格剖析
GARCH(1,1),MA 以及历史模拟法的 VaR 比拟
matlab 预计 arma garch 条件均值和方差模型 R 语言 POT 超阈值模型和极值实践 EVT 剖析

正文完
 0