乐趣区

关于数据挖掘:R语言多元线性回归ARIMA分析美国不同候选人对经济GDP时间序列影响

全文链接:http://tecdat.cn/?p=28144 

作者:Yuanchang Luo

近段时间,美国总统大选引起了世界各国的关注。共和党候选人唐纳德·特朗普和民主党候选人乔·拜登将角逐总统。两党候选人在金融贸易、经济金融治理以及防控措施等重点倒退畛域有着不同的政治立场和施政纲领。不同的政治立场的候选人对美国甚至全世界的经济倒退有着肯定的影响,本文联合具体数据,定量分析不同候选人对美国经济倒退的影响。

解决方案

工作 / 指标

依据美国各指标数据以及两位候选人的不同 政策,剖析出对美国经济的影响。

数据源筹备

在美国政府公开数据集上搜寻数据,共 26 类,并且用 GDP 来反映美国经济。失去数据后,因为是工夫序列数据,因而通过拉格朗日插值 法补充空值。并且,因为是美国政府公开的数 据集,因而默认异样值,即较大较小值是由实 际历史因素导致的,不作解决。

特色抽取

首先通过察看特色间的相关矩阵以及和因变量的相 关性,初步剔除 7 个与因变量相关性非常低且指标 间相关性较高的指标,应用残余19个自变量作为 回归剖析的指标。(剔除掉的指标:’ 美国个人收入 中位数 ’,’ 个人所得税(最高)’,’ 个人所得税(最低)‘,’ 商品和服务进口 ’,’ 金融资产净收买 ’,’ 劳动力市场状 况指数 ’,’ 失业率 ’)

建模

多元线性回归,个别利用与多个特色指标的回 归问题。在多元线性回归的过程中,除了思考模型的 AIC 最小外,还需思考模型间自变量互相的关 系对因变量的影响,即多重共线性,通过 VIF 来剔除相干自变量。ARIMA,个别利用在工夫序列畛域上。ARIMA 模型是指将非安稳工夫序列转化为平 稳工夫序列,而后将后果变量做自回归(AR)和自平移(MA)。

模型优化

1. 通过 VIF 准则剔除相干的自变量:

上图为 VIF 最后后果和最终后果。进一步筛选 7 个指标进行预测。

2. 通过 AIC 准则抉择最优模型

联合各因素的 t 测验以及模型的 AIC,通过向 前向后抉择的办法,抉择出最优的回归模型。

 

 

 

联合上图,确信此回归模型体现良好。

3. 工夫序列预测自变量

因为美国政府公开的数据截至到 19 年,而我 们须要 21 年 1 月份自变量的数据以次来预测 不同候选人入选对经济的影响,因而通过工夫 序列对 5 个指标往后预测 5 季度的数值。

4. 不同政策对特色的定量影响

联合不同候选人的政策,能够人为定性的剖析 出对各特色的影响是增大还是减小,而后通过 均匀 20 年的数据,算出各特色增大以及减小 的百分比均值,以此来预计影响的具体数值。这样一来,对历史数据通过 ARIMA 模型失去 20 年的的数据,而后通过各候选人的不同政 策对指标的影响以及历史变动均值,就失去了 21 年四个季度各指标的具体数值,而后通过 多元回归所得方程,预测 21 年 4 个季度的 GDP 具体数值。

我的项目后果 

多元回归方程:y= − 0.3478 − 0.08548x 2+1.579 × 10 −7 x 10 +4.653 × 10 −5 x 14+1.565 × 10 −5 x15+1.156x 19

联合对各指标的预测值,计算出不同候选人当 选对经济的影响:

 

能够看到,两位候选人的入选都会对美国经济有肯定的晋升,但拜登的入选无疑晋升更大,因而能够预计,拜登有更大的可能博得此次大 选。评估成果不能只看经济影响,要综合思考,须要参考不同候选人的具体政策带来的影响,以及不同党派不同群体对两位候选人的不同 态度。因而预测后果仅作为参考。

对于作者

在此对 Yuanchang Luo 对本文所作的奉献示意诚挚感激,他在西北大学实现了利用统计硕士学位,特长数据挖掘、数据分析、机器学习等。


最受欢迎的见解

1. 在 python 中应用 lstm 和 pytorch 进行工夫序列预测

2.python 中利用长短期记忆模型 lstm 进行工夫序列预测剖析

3.Python 用 RNN 循环神经网络:LSTM 长期记忆、GRU 门循环单元、回归和 ARIMA 对 COVID-19 新冠疫情新增人数工夫序列

4.Python TensorFlow 循环神经网络 RNN-LSTM 神经网络预测股票市场价格工夫序列和 MSE 评估准确性

5.r 语言 copulas 和金融工夫序列案例

6.R 语言用 RNN 循环神经网络、LSTM 长短期记忆网络实现工夫序列长期利率预测

7.Matlab 创立向量自回归(VAR)模型剖析消费者价格指数 (CPI) 和失业率工夫序列 和失业率工夫序列 ”)

8.r 语言 k -shape 工夫序列聚类办法对股票价格工夫序列聚类

9.R 语言联合新冠疫情 COVID-19 股票价格预测:ARIMA,KNN 和神经网络工夫序列剖析

退出移动版