关于算法:Stata广义矩量法GMM面板向量自回归-VAR模型选择估计Granger因果检验分析投资收入和消费数据

8次阅读

共计 5206 个字符,预计需要花费 14 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=24016 

摘要

面板向量自回归(VAR)模型在利用钻研中的利用越来越多。尽管专门用于预计工夫序列 VAR 模型的程序通常作为规范性能蕴含在大多数统计软件包中,但面板 VAR 模型的预计和推断通常用通用程序实现,须要一些编程技巧。在本文中,咱们简要探讨了狭义矩量法(GMM)框架下面板 VAR 模型的模型抉择、预计和推断,并介绍了一套 Stata 程序来不便地执行它们。

一、简介

工夫序列向量自回归 (VAR) 模型起源于宏观计量经济学文献,作为多元联立方程模型的替代品 (Sims, 1980)。VAR 零碎中的所有变量通常都被视为内生变量,只管可能会依据实践模型或统计程序来确定限度,以解决外生冲击对系统的影响。随着 VAR 在面板数据设置中的引入(Holtz-Eakin、Newey 和 Rosen,1988),面板 VAR 模型已在跨畛域的多个利用中应用。

在本文中,咱们简要概述了狭义矩量法 (GMM) 框架中面板 VAR 模型的抉择、预计和推理,并提供了一组 Stata 程序,咱们应用国家纵向考察和投资、支出和生产数据。包含实现 Granger(1969)因果关系测验的子程序,以及依照 Andrews 和 Lu(2001)进行的最佳时刻和模型抉择。

2. 面板向量自回归

咱们思考具备特定面板固定效应的阶数 - 变量面板 VAR,由以下线性方程组示意:

其中,是因变量的(1)向量;是外生协变量的(1)向量;以及 别离是因变量特定的固定效应和特异性误差的(1)向量。矩阵和 矩阵是要预计的参数。咱们假如翻新点具备以下特色。

下面的参数能够与固定效应联结预计,或者在一些转换后独立于固定效应,应用一般最小二乘法 (OLS)。然而,因为方程组右侧存在滞后因变量,即便是大的预计也会有偏差(尼克尔,1981)。只管偏差随着变大而趋近于零,但 Judson 和 Owen (1999) 的模仿发现即便在 = 30 时也存在显着偏差。

2.1.GMM 预计

曾经提出了基于 GMM 的各种预计器来计算上述方程的统一预计。4 在咱们假如误差是间断不相干的状况下,一阶差分变换能够通过用较早期间的差别和程度检测滞后差别,如安德森和萧 (1982) 所提出的那样,一一方程地统一预计。然而,这个预计会带来一些问题。一阶差分变换放大了不均衡面板中的间隙。例如,如果某些不可用,则工夫和 − 1 处的一阶差分同样缺失。此外,察看每个面板的必要时间段随着面板 VAR 的滞后程序而变大。例如,对于二阶面板 VAR,

Arellano 和 Bover (1995) 提出前向正交偏差作为代替变换,它不具备一阶差分变换的毛病。它不应用与过来实现的偏差,而是减去所有可用的将来察看的平均值,从而最大限度地缩小数据失落。可能只有最近的察看不会用于预计。因为过来的实现不包含在这个转换中,它们依然是无效的工具。例如,在二阶面板 VAR 中,只有 ≥ 4 个实现能力在程度上应用工具。

尽管一一方程的 GMM 预计会产生对面板 VAR 的统一预计,但将模型预计为方程组可能会导致效率增益(Holtz-Eakin、Newey 和 Rosen,1988 年)。思考以下基于等式 (1) 的变换面板 VAR 模型,但以更紧凑的模式示意:

  

其中星号示意原始变量的某种变换。如果咱们把原始变量示意为,那么第一差分转换意味着,而对于正向正交偏差 ,其中是面板在工夫上的可用将来观测值的数量,是其平均值。

假如咱们随着工夫的推移将察看叠加在面板上。GMM 估计量由下式给出

其中是一个 () 加权矩阵,假设为非奇怪、对称和半正定。假如 和 rank,GMM 估计量是统一的。能够抉择加权矩阵来最大化效率(Hansen,1982)。

方程组的联结预计使穿插方程假设检验变得简单明了。能够基于 的 GMM 预计及其协方差矩阵来实现对于参数的 Wald 测验。格兰杰因果测验,假如变量 的方程中变量滞后的所有系数独特为零,同样能够应用该测验进行。

2.2. 模型抉择

面板 VAR 剖析的前提是在面板 VAR 标准和矩条件中抉择最佳滞后阶数。Andrews 和 Lu(2001)提出了基于 Hansen(1982)统计学的适度辨认限度的 GMM 模型的统一时刻和模型抉择规范(MMSC)。他们提出的 MMSC 相似于各种罕用的基于最大似然的模型抉择规范,即 Akaike 信息规范 (AIC) (Akaike, 1969)、贝叶斯信息规范 (BIC) (Schwarz, 1978; Rissanen, 1978; Akaike, 1977),以及 Hannan-Quinn 信息规范 (HQIC)(Hannan 和 Quinn,1979)。

将 Andrews 和 Lu 的 MMSC 利用 GMM 预计,他们提出的规范抉择最小化的向量对

其中 是基于样本大小为 的因变量滞后的阶次和矩条件的变量面板 VAR 的适度辨认限度的统计量。

通过结构,上述 MMSC 仅在 时可用。作为代替规范,即便应用刚刚辨认的 GMM 模型,也能够计算整体确定系数 (CD)。假如咱们用 示意因变量的 无约束协方差矩阵。CD 为面板 VAR 模型解释的变异比例,能够计算为

2.3. 脉冲响应

咱们删除外生变量,并专一于方程(1)中面板 VAR 的自回归构造。Lutkepohl (2005) 和 Hamilton (1994) 都表明,如果随同矩阵的所有模都严格小于 1,则 VAR 模型是稳固的,其中随同矩阵由

稳定性意味着面板 VAR 是可逆的,并且具备有限阶向量挪动均匀 (VMA) 示意,为预计的脉冲响应函数和预测误差方差合成提供已知的解释。能够通过将模型重写为有限向量挪动均匀来计算简略的脉冲响应函数,其中 是 VMA 参数。

然而,简略的 IRF 没有因果解释。因为翻新是同时相干的,一个变量的冲击很可能随同着其余变量的冲击。假如咱们有一个矩阵 ,使得。而后可用于将翻新点正交化,并将 VMA 参数转换为正交化的脉冲响应。矩阵无效地对动静方程组施加了辨认限度。Sims (1980) 提出了 的 Cholesky 合成以在 VAR 上强加递归结构。然而,合成不是惟一的,而是取决于 中变量的程序。

脉冲响应函数置信区间能够基于面板 VAR 参数的渐近散布和穿插方程误差方差 - 协方差矩阵剖析导出。或者,也能够应用蒙特卡罗模仿和自举重采样办法来预计置信区间。

2.4. 预测误差方差合成

ℎ步提前预测误差能够示意为

其中 是在工夫 + ℎ 处的察看向量, 是在工夫 ℎ 预测的提前 ℎ 步预测向量。与脉冲响应函数相似,咱们应用矩阵将冲击正交化,以隔离每个变量对预测误差方差的奉献。正交化冲击 有一个协方差矩阵 ,能够间接合成预测误差方差。更具体地说,m 变量对变量 n 的ℎ步预测误差方差的奉献能够计算为

在利用中,奉献通常绝对于变量的ℎ步超前预测误差方差进行归一化。

与脉冲响应函数相似,置信区间能够通过剖析得出或应用各种重采样技术进行预计

4. 例子

咱们通过剖析年工作工夫和小时支出之间的关系来阐明 pvar 应用,Holtz-Eakin、Newey 和 Rosen(1988)之前在他们对于面板向量自回归的开创性论文中对此进行了剖析。为了将咱们的新程序与 Stata 的内置 var 命令套件进行比拟,咱们还将新的 pvar 利用于投资、支出和生产数据工夫序列数据。

咱们通过剖析年工作工夫和小时支出之间的关系来阐明 pvar 应用,Holtz-Eakin、Newey 和 Rosen(1988)曾在他们对于面板向量自回归的开创性论文中剖析过这种关系。咱们还将 pvar 利用于 Lutkephol(1993)的工夫序列数据。

4.1. 全国纵向考察数据

咱们应用来自 1968 年至 1978 年国家纵向考察的 1968 年 14-26 岁女性子样本。咱们的子样本由 2,039 名女性组成,她们在至多三轮考察中报告了工资(wage)和年工作时数(hours),其中两轮是间断年份。应用雷同的考察,但具备不同的时间段和不同的工人子样本,因而后果可能不具备间接可比性。

上面是应用模型抉择,用于以工时和工资的前四个滞后期为工具的一到三阶面板 VARs。

.ua3 vs(ns(1/4))
.gen wge = exp(nwage)
.erk

基于 Andrews 和 Lu (2001) 的三个模型抉择规范和整体决定系数,一阶面板 VAR 是首选模型,因为它具备最小的 MBIC、MAIC 和 MQIC。尽管咱们也想最小化 Hansen 的 J 统计量,但它并没有像 Andrews 和 Lu 的模型和矩抉择规范那样修改模型中的自由度。基于抉择规范,咱们应用由 pvar 实现的 GMM 预计拟合具备与上述雷同的一阶面板 VAR 模型。

面板向量自回归
. wg rs, in(1/4)

请留神,预计中包含的 506 名妇女显著少于数据中的全副妇女子样本。默认状况下,pvar 会从预计中删除任何缺失数据的察看。因为子样本中的所有妇女的工作工夫和工资并不是在所有年份都被察看到的,所以被剔除的察看值的数量会随着作为工具变量的滞后阶数而减少。咱们能够通过应用 Holtz-Eakin 等人提出的 “GMM 式 “ 工具来改善预计。这减少了预计样本,从而使预计更加无效。

 

面板向量自回归
.s tl(1/4) gmm

只管能够从下面的 var 输入推断出一阶面板 VAR 的格兰杰因果关系,但咱们依然应用 granger 作为阐明进行测验。上面格兰杰因果测验的结果表明,在通常的置信水平下,工资格兰杰导致工时和工时格兰杰导致工资,这与 Holtz-Eakin 等人的发现类似。

. granger

面板向量自回归模型预计很少由其本身解释。在实践中,钻研人员通常对面板 VAR 零碎中每个内生变量的外生变动对其余变量的影响感兴趣。然而,在预计脉冲响应函数 (IRF) 和预测误差方差合成 (FEVD) 之前,咱们首先查看预计面板 VAR 的稳定性条件。生成的特征值表和图证实了预计是稳固的。

.table, rph

咱们认为工资水平的冲击对同期的工作工夫有间接影响,而以后的工作致力只影响将来的工资。应用这种因果程序,咱们应用 fevd 计算了隐含的 IRF,应用 fevd 计算了隐含的 FEVD。IRF 置信区间是依据预计模型应用 200 次蒙特卡罗绘制计算的。FEVD 估计值的标准误差和置信区间同样可用。

.
. pirf, c20) irf op

依据 FEVD 的预计,咱们看到,在咱们的例子中,多达 40% 的妇女工作工夫的变动能够由她们的工资来解释。另一方面,工作工夫只解释了妇女将来工资变动的 5%。就程度而言,IRF 图显示,实际工资的正冲击导致工作致力的缩小,这意味着样本中妇女的劳动供应向后蜿蜒。同样值得注意的是,当前工作强度的冲击对工作工夫和工资都有踊跃但短暂的影响。另一方面,以后冲击对工资的影响对将来工资有继续的踊跃影响。

 

4.2. 投资、支出和生产数据

咱们应用投资、支出和生产数据工夫序列数据进行比拟。该数据蕴含从 1962 年第二季度到 1982 年第四季度的投资、支出和生产 自然对数的一阶差分。仅应用截至第四季度的观测值 1978 年在他的例子中,但咱们在这里的阐明中应用了残缺的样本。咱们将工夫序列数据设置为单面板数据,以便 pvar 发挥作用。

delta: 1 qt
time vaabl qr, 1960q1 to 1982q4
panel aiale: id 
. xet d tr
. gen id = 1
. wue utph2

为简略起见,咱们应用内置的 var(在上面的输入中示意为 var1)和新的 pvar 来比拟 VAR(1) 估计值。VAR/ 面板 VAR 点估计总结为下表。依据计算的点估计和标准误差,请留神每个系数的 95% 置信区间,即点估计两侧的大概两个标准误差,在估计量之间重叠。此外,因为前向正交变换,pvar 应用的察看值比 var 少一个。

. est table v1\_pvr5, st(Nmntmx) drop(\_cons)
. est tor pr1
. est store ar1_
. qui al_ l_ic dnm, gs(1)
. est sor vr1

Cholesky 脉冲响应函数和预测误差方差合成同样能够应用新的 Stata 命令 pvarirf 和 pvarfevd 进行预计。与 VAR/ 面板 VAR 点估计相似,95% 置信区间三个估计量的 Cholesky IRF 和 FEVD 重叠。上面,咱们应用三个模型展现了 inv 对 inv 上一个标准差冲击的响应。

 

5. 参考

Akaike, H. (1969)。拟合自回归模型进行预测。统计数学研究所年鉴,21, 243-247。
 


 

最受欢迎的见解

1. 在 python 中应用 lstm 和 pytorch 进行工夫序列预测

2.python 中利用长短期记忆模型 lstm 进行工夫序列预测剖析

3. 应用 r 语言进行工夫序列(arima,指数平滑)剖析

4.r 语言多元 copula-garch- 模型工夫序列预测

5.r 语言 copulas 和金融工夫序列案例

6. 应用 r 语言随机稳定模型 sv 解决工夫序列中的随机稳定

7.r 语言工夫序列 tar 阈值自回归模型

8.r 语言 k -shape 工夫序列聚类办法对股票价格工夫序列聚类

9.python3 用 arima 模型进行工夫序列预测

正文完
 0