关于数据挖掘:R语言单位根协整关系Granger因果检验RESET分析汇率在岸和离岸数据时间序列

40次阅读

共计 8220 个字符,预计需要花费 21 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=32188

原文出处:拓端数据部落公众号

单位根的随机性趋势与协整关系对实证剖析中工夫序列的影响是不容小觑的。测验的目标在于更好的分辨数据个性、甄选模型,以达到或能预测或能证实因果关系或否定以上两者的后果。

单位根测验

基本思路

在进行工夫序列剖析时, 传统上要求所用的工夫序列必须是安稳的, 否则将会产生伪回归。然而, 在事实经济中的工夫序列通常是非安稳的, 因为各类经济变量个别都随经济增长而产生周期性变动。如果间接采纳最小二乘法进行回归剖析, 即便两个变量之间不存在相关性, 也有可能失去一个很高的拟和优度, 这就是所谓的舛误回归景象。

为了帮忙客户使回归失去的方程更有意义, 能够通过差分失去安稳化的序列, 而后再进行回归。为了判断工夫序列是否安稳,能够应用单位根测验。对于工夫序列 yt 可用如下自回归模型测验单位根。

协整测验

基本思路:

20 世纪 80 年代,Engle 和 Granger 等人提出了协整(Co-integration)的概念,指出两个或多个非安稳(non-stationary)的工夫序列的线性组合可能是安稳的或是较低阶单整的。有些工夫序列,尽管它们本身非安稳,但其线性组合却是安稳的。非安稳工夫序列的线性组合如果安稳,则这种组合反映了变量之间长期稳固的比例关系,称为协整关系。协整关系表白的是两个线性增长量的稳固的动静平衡关系,更是多个线性增长的经济量相互影响及本身演变的动静平衡关系。协整剖析是在工夫序列的向量自回归剖析的根底上倒退起来的空间结构与工夫动静相结合的建模办法与实践分析方法。

实证模型

本文选取了 BLOOMBERG 零碎报价的一个月期和一年期的人民币离岸 NDF 汇率收盘价、以及国家外汇管理局颁布的人民币对美元即期汇率中间价,别离作为人民币离岸 NDF 汇率与境内人民币汇率的代理变量。思考到 NDF 监管政策与我国新的《外汇管理条例》可能对人民币离岸 NDF 与境内人民币即期汇率的影响,本文样本人民币离岸 NDF 汇率数据来源于 BLOOMBERG 零碎,即期汇率数据来源于国家外汇管理局网站。因为境内外节假日的不同,当境内外人民币汇率日期不匹配时,将对应日期的数据删除。因为境内外节假日的不同,当境内外人民币汇率日期不匹配时,将对应日期的数据删除。

数据:USDCNH 在岸与 USDCNH 离岸月度同比数据

读取数据


library(openxlsx)
setwd("E:/USDCNH 离岸")
#在岸
data1=read.csv("历史在岸人民币美元.csv")
#离岸
data2=read.csv("USDCNH 离岸.csv")

1、单位根测验

须要进行节令调整,给出输入后果

(1)若存在单位根,用差分后序列进行 2、3、4 步;

(2)若不存在单位根,就用原序列。

USDCNH 在岸数据

首先,对 USDCNH 在岸数据和离岸数据工夫序列进行线性拟合,看数据随工夫变动的趋势。对在岸数据的线性拟合模型后果如下。从上面的后果能够看到工夫对在岸数据有较大影响,因而该数据不是安稳的序列。

## Residuals:  
##      Min       1Q   Median       3Q      Max  
## -0.15097 -0.06398  0.01261  0.06016  0.12913  
##  
## Coefficients:  
##              Estimate Std. Error t value Pr(>|t|)     
## (Intercept) 6.040e+00  9.331e-03  647.33   <2e-16 ***  
## t           1.565e-03  6.685e-05   23.41   <2e-16 ***  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.0722 on 239 degrees of freedom  
## Multiple R-squared:  0.6963, Adjusted R-squared:  0.695  
## F-statistic: 547.9 on 1 and 239 DF,  p-value: < 2.2e-16

对 USDCNH 在岸数据和离岸数据工夫序列进行 ADF 单位根测验,抉择程度值,蕴含趋势项和漂移项,最大滞后期数依照 SIC(Schwarz Info Criterinon)准则,单位根测验后果如下:

##  Augmented Dickey-Fuller Test  
##  
## data:  x  
## Dickey-Fuller = -1.3371, Lag order = 0, p-value = 0.1453  
## alternative hypothesis: explosive

## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.036883 -0.004066 -0.001072  0.002078  0.109471  
##  
## Coefficients:  
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  8.724e-02  6.561e-02   1.330   0.1849   
## z.lag.1     -1.452e-02  1.086e-02  -1.337   0.1825   
## tt           3.925e-05  2.032e-05   1.932   0.0545 .  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.01209 on 237 degrees of freedom  
## Multiple R-squared:  0.01648,    Adjusted R-squared:  0.008183  
## F-statistic: 1.986 on 2 and 237 DF,  p-value: 0.1395  
##  
##  
## Value of test-statistic is: -1.3371 2.6159 1.9859  
##  
## Critical values for test statistics:  
##       1pct  5pct 10pct  
## tau3 -3.99 -3.43 -3.13  
## phi2  6.22  4.75  4.07  
## phi3  8.43  6.49  5.47

承受原假如 H 0:序列 x t 非安稳

数据差分

本文用 ADF(Augmented Dick-ey-Fuller Test)单位根测验来测验工夫序列的平稳性。下面列出了人民币在岸汇率程度变量的单位根测验后果。从后果中 能够看到人民币 在岸汇率的 ADF 统计量均大于临界值,且 P 值都较大,表明它们是非安稳变量,而它们的一阶差分值的 ADF 统计量均小于临界值,且 P 值都是 0,表明它们的一阶差分变量是安稳的,因而可知在岸汇率均为一阶单整过程,即 I(1)过程。

USDCNH 离岸数据

 首先,对 USDCNH 离岸数据工夫序列进行线性拟合,看数据随工夫变动的趋势。对在岸数据的线性拟合模型后果如下。从上面的后果能够看到工夫对离岸数据有较大影响,因而该数据不是安稳的序列。

## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.122283 -0.059687 -0.008484  0.067933  0.158961  
##  
## Coefficients:  
##              Estimate Std. Error t value Pr(>|t|)     
## (Intercept) 6.153e+00  9.250e-03  665.22   <2e-16 ***  
## t           1.269e-03  6.627e-05   19.14   <2e-16 ***  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.07157 on 239 degrees of freedom  
## Multiple R-squared:  0.6053, Adjusted R-squared:  0.6037  
## F-statistic: 366.5 on 1 and 239 DF,  p-value: < 2.2e-16

首先,对 USDCNH 离岸数据工夫序列进行 ADF 单位根测验,抉择程度值,蕴含趋势项和漂移项,最大滞后期数依照 SIC(Schwarz Info Criterinon)准则,单位根测验后果如下:

##  Augmented Dickey-Fuller Test  
##  
## data:  x  
## Dickey-Fuller = -1.8566, Lag order = 0, p-value = 0.3638  
## alternative hypothesis: explosive

 ##  
## ###############################################  
## # Augmented Dickey-Fuller Test Unit Root Test #  
## ###############################################  
##  
## Test regression trend  
##
## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.078389 -0.007280 -0.002134  0.006500  0.182221  
##  
## Coefficients:  
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  1.910e-01  1.034e-01   1.847   0.0659 .  
## z.lag.1     -3.119e-02  1.680e-02  -1.857   0.0646 .  
## tt           5.848e-05  2.726e-05   2.145   0.0330 *  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.0185 on 237 degrees of freedom  
## Multiple R-squared:  0.01943,    Adjusted R-squared:  0.01115  
## F-statistic: 2.348 on 2 and 237 DF,  p-value: 0.09778  
##  
##  
## Value of test-statistic is: -1.8566 2.0347 2.348  
##  
## Critical values for test statistics:  
##       1pct  5pct 10pct  
## tau3 -3.99 -3.43 -3.13  
## phi2  6.22  4.75  4.07  
## phi3  8.43  6.49  5.47

因而,采纳 ADF 测验别离对在岸与离岸汇率收益率序列进行单位根测验,结果表明各序列都是非安稳序列,一阶差分数据为安稳序列。

因为, 原来两个工夫序列都是非安稳的,但通过二次差分后变为安稳序列, 也就是说它们都是二阶单整的, 满足协整测验的前提。因而,上面进行 Granger 因果测验。

这里咱们采纳 Granger 因果测验对上述在岸数据和离岸数据之间的因果关系进行测验。

2. 测验协整关系——EG 两步法

给出输入后果

(1)若存在长期协整,用 VECM 法线性过滤,利用利用过滤后的“残差成分”再进行 3,4 步;

(2)若不存在长期协整,就不必过滤,间接进行 3、4 步。

 因为在岸数据与离岸数据之间可能存在相互影响,以至采纳简略的双变量协整测验,后果可能呈现肯定的偏差。为此,别离预计以在岸数据为被解释变量的双变量VECM模型和以离岸数据为被解释变量双变量VECM模型,失去基于VECM模型中在岸数据的回归残差和基于VECM模型中离岸数据的回归残差,进一步采纳RESET测验等测验办法,对经VECM模型线性过滤后的残差进行测验。表的测验结果表明,所有测验均显著回绝线性关系的原假如,这阐明在岸数据与离岸数据并不是出现线性的变化趋势,而可能是存在着显著的动静变化趋势。因而,有必要采纳Granger因果关系测验,进一步考查在岸数据与离岸数据之间可能存在的关系。

## Residuals:  
##       Min        1Q    Median        3Q       Max  
## -0.090676 -0.005832 -0.000346  0.007055  0.097828  
##  
## Coefficients:  
##              Estimate Std. Error t value Pr(>|t|)     
## (Intercept) 0.0002001  0.0010342   0.194    0.847     
## USDCNH 在岸  0.7911232  0.0848505   9.324   <2e-16 ***  
## ---  
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1  
##  
## Residual standard error: 0.01593 on 239 degrees of freedom  
## Multiple R-squared:  0.9667, Adjusted R-squared:  0.2637  
## F-statistic: 86.93 on 1 and 239 DF,  p-value: < 2.2e-16

从下面的后果能够看到长期平衡方程的拟合优度高达 0.9667,阐明该方程有很强的可靠性。通过该方程咱们能够看到,USDCNH 在岸与 USDCNH 离岸之间有显著的影响。USDCNH 在岸每减少一个单位,USDCNH 离岸增长 0.7911232 亿元。

绘制长期残差

基于VECM模型回归残差的测验结果表明在岸数据与离岸数据出现的动静变化趋势,为了揭示在岸数据与离岸数据之间的关系,文章别离格兰杰因果测验办法,对经VECM模型线性过滤后的残差进行Granger因果关系测验,基于独特滞后阶数 Lx=Ly,并将测验窗宽设置为 e=1.5σ 的测验后果如表所示

3、测验——RESET 测验办法

##  RESET test  
##  
## data:  data$USDCNH 离岸 ~ data$USDCNH 在岸  
## RESET = 35.913, df1 = 1, df2 = 238, p-value = 7.585e-09

用RESET测验等测验办法,对经VECM模型线性过滤后的残差进行测验。的测验结果表明,所有测验均显著回绝线性关系的原假如,这阐明在岸数据与离岸数据并不是出现线性的变化趋势,而可能是存在着显著的动静变化趋势。

4、格兰杰因果测验


##           日期 USDCNH 在岸 USDCNH 离岸  
## 1   2015-01-05     0.0000     0.0000  
## 2   2015-01-06     0.0008    -0.0012  
## 3   2015-01-07     0.0013    -0.0150  
## 4   2015-01-08     0.0033     0.0041  
## 5   2015-01-09    -0.0006     0.0018  
## 6   2015-01-12    -0.0063    -0.0128。。。## 228 2015-12-14     0.0137     0.0178  
## 229 2015-12-15     0.0064    -0.0155  
## 230 2015-12-16     0.0067    -0.0162  
## 231 2015-12-17     0.0131     0.0446  
## 232 2015-12-18     0.0057    -0.0108  
## 233 2015-12-21    -0.0061    -0.0055  
## 234 2015-12-22    -0.0007    -0.0255  
## 235 2015-12-23    -0.0015     0.0182  
## 236 2015-12-24     0.0024    -0.0009  
## 237 2015-12-25    -0.0042    -0.0014  
## 238 2015-12-28     0.0037     0.0182  
## 239 2015-12-29     0.0114     0.0154  
## 240 2015-12-30     0.0031    -0.0085  
## 241 2015-12-31     0.0041     0.0013

以进行格兰杰因果测验。对在岸和离岸汇率收益率序列进行 Granger 因果测验,最优滞后期数是依据 AIC 信息准则和 SC 信息准则确定的。在岸人民币汇率、离岸市场汇率的 Granger 因果关系测验后果见表。该结果显示:在岸人民币汇率和离岸市场人民币汇率具备双向溢出效应,两个市场能够互相疏导汇率的变动,并且该变动信息在滞后七期当前能够在 1% 的显著性程度下影响对方市场当期的汇率。综合各市场之间的报酬溢出关系,认为人民币离岸市场位于价格主导地位,而且人民币离岸市场对在岸人民币汇率的疏导滞后期较短。

##  Granger causality H0: USDCNH 在岸 do not Granger-cause USDCNH 离岸  
##  
## data:  VAR object var.2c  
## F-Test = 0.6178, df1 = 2, df2 = 468, p-value = 0.5396  
##  
##  
## $Instant  
##  
##  H0: No instantaneous causality between: USDCNH 在岸 and USDCNH 离岸  
##  
## data:  VAR object var.2c  
## Chi-squared = 64.173, df = 1, p-value = 1.11e-15

## $Granger  
##  
##  Granger causality H0: USDCNH 离岸 do not Granger-cause USDCNH 在岸  
##  
## data:  VAR object var.2c  
## F-Test = 9.2651, df1 = 2, df2 = 468, p-value = 0.0001132  
##  
##  
## $Instant  
##  
##  H0: No instantaneous causality between: USDCNH 离岸 and USDCNH 在岸  
##  
## data:  VAR object var.2c  
## Chi-squared = 64.173, df = 1, p-value = 1.11e-15

从测验统计量来看,回绝“在岸数据不是离岸数据的Granger因果起因”的原假如,而都显著回绝了“离岸数据不是在岸数据的Granger因果起因”的原假如,表明存在着由离岸数据到在岸数据的双向Granger因果关系。这阐明离岸数据是引起在岸数据变动的Granger因果起因。意味着价格回升,可能通过生产链向上游的生产商品价格传导,从而加大物价上涨的压力,也增大了“老本推动型通货膨胀”引发的危险。即两个市场的人民币汇率存在双向的汇集度和长久度的稳定溢出,该后果印证了人民币离岸市场因为自由化程度较高,没有政府外汇管制,在这两个市场间信息传递水平最高。


最受欢迎的见解

1. 在 python 中应用 lstm 和 pytorch 进行工夫序列预测

2.python 中利用长短期记忆模型 lstm 进行工夫序列预测剖析

3.Python 用 RNN 循环神经网络:LSTM 长期记忆、GRU 门循环单元、回归和 ARIMA 对 COVID-19 新冠疫情新增人数工夫序列

4.Python TensorFlow 循环神经网络 RNN-LSTM 神经网络预测股票市场价格工夫序列和 MSE 评估准确性

5.r 语言 copulas 和金融工夫序列案例

6.R 语言用 RNN 循环神经网络、LSTM 长短期记忆网络实现工夫序列长期利率预测

7.Matlab 创立向量自回归(VAR)模型剖析消费者价格指数 (CPI) 和失业率工夫序列

8.r 语言 k -shape 工夫序列聚类办法对股票价格工夫序列聚类

9. R 语言联合新冠疫情 COVID-19 股票价格预测:ARIMA,KNN 和神经网络工夫序列剖析

正文完
 0