关于数据挖掘:R语言面板平滑转换回归PSTR分析案例实现附代码数据

全文下载链接： http://tecdat.cn/?p=3765

最近咱们被客户要求撰写对于PSTR的钻研报告，包含一些图形和统计输入。

在本文中，建模过程包含三个阶段：表述，预计和评估，本文帮忙用户进行模型表述、预计，进行PSTR模型评估（ 点击文末“浏览原文”获取残缺代码数据******** ）。

在程序包中实现了集群依赖性和异方差性一致性测验。

还实现了wild bootstrap和cluster wild bootstrap测验。

并行计算（作为选项）在某些函数中实现，尤其是bootstrap测验。因而，该程序包适宜在超级计算服务器上运行多个外围的工作。

数据

“Hansen99”数据集来提供示例。

初始化

能够通过执行创立PSTR类的新对象

 
 #> Summary of the model:
#> ---------------------------------------------------------------------------
#>   time horizon sample size = 14,  number of individuals = 560
#> ---------------------------------------------------------------------------
#> Dependent variable:  inva
#> ---------------------------------------------------------------------------
#> Explanatory variables in the linear part:
#>   dt_75 dt_76 dt_77 dt_78 dt_79 dt_80 dt_81 dt_82 dt_83 dt_84 dt_85 dt_86 dt_87 vala debta cfa sales
#> ---------------------------------------------------------------------------
#> Explanatory variables in the non-linear part:
#>   vala debta cfa sales
#> ---------------------------------------------------------------------------
#> Potential transition variable(s) to be tested:
#>   vala
#> ###########################################################################
#> ***************************************************************************
#> Results of the linearity (homogeneity) tests:
#> ***************************************************************************
#> Sequence of homogeneity tests for selecting number of switches 'm':
#> ***************************************************************************
#> ###########################################################################

因变量是“inva”，第4列到第20列的数据中的变量是线性局部的解释变量，非线性局部中的解释变量是“indep\_k”中的四个，潜在的转换变量是“vala”（Tobin的Q）。

以下代码执行线性测验

 #> ###########################################################################
#> ***************************************************************************
#> Results of the linearity (homogeneity) tests:
#> ---------------------------------------------------------------------------
#> LM tests based on transition variable 'vala'
#>   m  LM_X PV  LM_F PV HAC_X        PV HAC_F        PV
#>   1 125.3  0 28.99  0 30.03 4.819e-06 6.952 1.396e-05
#> ***************************************************************************
#> Sequence of homogeneity tests for selecting number of switches 'm':
#> ---------------------------------------------------------------------------
#> LM tests based on transition variable 'vala'
#>   m  LM_X PV  LM_F PV HAC_X        PV HAC_F        PV
#>   1 125.3  0 28.99  0 30.03 4.819e-06 6.952 1.396e-05
#> ***************************************************************************
#> ###########################################################################

能够看到函数“LinTest”获取PSTR对象“pstr”并返回后果。因为解决包中PSTR对象的函数通过增加新的atrributes来更新对象。当然能够创立新的PSTR对象来获取返回值，以便保留模型的不同设置的后果。

能够通过运行以下代码来执行wild bootstrap和wild cluster bootstrap。

预计

当确定要用于预计的转换变量时，在本例中为“inva”，能够预计PSTR模型

 print(pstr,"estimates")

默认状况下，应用“optim”办法“L-BFGS-B”，但能够通过更改优化办法进行估算

 print(pstr,"estimates")
#> ###########################################################################
 #> ###########################################################################
#> ***************************************************************************
#> Results of the PSTR estimation:
#> ---------------------------------------------------------------------------
#> Transition variable 'vala' is used in the estimation.
#> ---------------------------------------------------------------------------
#> Parameter estimates in the linear part (first extreme regime) are
#>        dt_75_0   dt_76_0   dt_77_0   dt_78_0  dt_79_0  dt_80_0   dt_81_0
#> Est  -0.002827 -0.007512 -0.005812 0.0003951 0.002464 0.006085 0.0004164
#> s.e.  0.002431  0.002577  0.002649 0.0027950 0.002708 0.002910 0.0029220
#>        dt_82_0   dt_83_0    dt_84_0  dt_85_0   dt_86_0   dt_87_0  vala_0
#> Est  -0.007802 -0.014410 -0.0009146 0.003467 -0.001591 -0.008606 0.11500
#> s.e.  0.002609  0.002701  0.0030910 0.003232  0.003202  0.003133 0.04073
#>       debta_0   cfa_0  sales_0
#> Est  -0.03392 0.10980 0.002978
#> s.e.  0.03319 0.04458 0.008221
#> ---------------------------------------------------------------------------
#> Parameter estimates in the non-linear part are
#>        vala_1 debta_1    cfa_1  sales_1
#> Est  -0.10370 0.02892 -0.08801 0.005945
#> s.e.  0.03981 0.04891  0.05672 0.012140
#> ---------------------------------------------------------------------------
#> Parameter estimates in the second extreme regime are
#>      vala_{0+1} debta_{0+1} cfa_{0+1} sales_{0+1}
#> Est    0.011300    -0.00500   0.02183    0.008923
#> s.e.   0.001976     0.01739   0.01885    0.004957
#> ---------------------------------------------------------------------------
#> Non-linear parameter estimates are
#>       gamma        c_1
#> Est  0.6299 -0.0002008
#> s.e. 0.1032  0.7252000
#> ---------------------------------------------------------------------------
#> Estimated standard deviation of the residuals is 0.04301
#> ***************************************************************************
#> ###########################################################################

还实现了线性面板回归模型的预计。

 print(pstr0,"estimates")
#> ###########################################################################
#> ## PSTR 1.2.4 (Orange Panel)
#> ###########################################################################
#> ***************************************************************************
#> A linear panel regression with fixed effects is estimated.
#> ---------------------------------------------------------------------------
#> Parameter estimates are
#>          dt_75     dt_76     dt_77    dt_78    dt_79    dt_80    dt_81
#> Est  -0.007759 -0.008248 -0.004296 0.002356 0.004370 0.008246 0.004164
#> s.e.  0.002306  0.002544  0.002718 0.002820 0.002753 0.002959 0.002992
#>          dt_82     dt_83    dt_84    dt_85    dt_86     dt_87     vala
#> Est  -0.005294 -0.010040 0.006864 0.009740 0.007027 0.0004091 0.008334
#> s.e.  0.002664  0.002678 0.003092 0.003207 0.003069 0.0030080 0.001259
#>          debta     cfa    sales
#> Est  -0.016380 0.06506 0.007957
#> s.e.  0.005725 0.01079 0.002412
#> ---------------------------------------------------------------------------
#> Estimated standard deviation of the residuals is 0.04375
#> ***************************************************************************
#> ###########################################################################

评估

能够基于预计的模型进行评估测试请留神，在“EvalTest”中，每次只有一个转换变量用于非线性测试。这与“LinTest”函数不同，后者能够采纳多个转换变量。这就是为什么我将后果保留到新的PSTR对象“pstr1”而不是笼罩的起因。通过这样做，我能够在新对象中保留来自不同转换变量的更多测试后果。

iB = 5000
cpus = 50

## wild bootstrap time-varyint评估测验
pstr = WCB_TVTest(use=pstr,iB=iB,parallel=T,cpus=cpus)

## wild bootstrap异质性评估测验
pstr1 = WCB_HETest(use=pstr1,vq=pstr$mQ[,1],iB=iB,parallel=T,cpus=cpus)

请留神，评估函数不承受线性面板回归模型中返回的对象“pstr0”，因为评估测试是针对预计的PSTR模型设计的，而不是线性模型。

可视化

估算PSTR模型后，能够绘制预计的转换函数

还能够依据转换变量绘制系数曲线，标准误差和p值。

点击题目查阅往期内容

R语言时变面板平滑转换回归模型TV-PSTR剖析债权程度对投资的影响

左右滑动查看更多

绘图plot_response，形容了PSTR模型的因变量和一些解释性变量。

咱们能够看到，如果没有非线性，对变量的响应是一条直线。如果变量和转换变量是不同的，咱们能够绘制曲面，z轴为响应，x轴和y轴为两个变量。如果变量和转换变量雷同，则变为曲线。

咱们通过运行来制作图表

x轴上的数字看起来不太好，因为很难找到转折点的地位。

该ggplot2软件包容许咱们手动绘制数字。

当初咱们十分分明地看到，大概0.5的转折点将曲线切割成两种状态，并且两种状态的行为齐全不同。该图表是对于托宾Q对预期投资的滞后影响。低Q值公司（其后劲被金融市场评估为低）可能不太违心扭转他们将来的投资打算，或者可能会扭转。

本文摘选《 R语言面板平滑转换回归(PSTR)剖析案例实现 》，点击“浏览原文”获取全文残缺材料。

点击题目查阅往期内容

R语言时变面板平滑转换回归模型TV-PSTR剖析债权程度对投资的影响\
面板平滑转换回归(PSTR)剖析案例实现\
R语言自适应平滑样条回归剖析\
R语言工夫序列数据指数平滑法分析交互式动静可视化\
R语言中的狭义线性模型（GLM）和狭义相加模型（GAM）：多元（平滑）回归剖析保险资金投资组合信用风险敞口\
R语言预测人口死亡率：用李·卡特（Lee-Carter）模型、非线性模型进行平滑预计\
基于R统计软件的三次样条和平滑样条模型数据拟合及预测\
R语言实现CNN（卷积神经网络）模型进行回归数据分析\
R语言中的多项式回归、B样条曲线(B-spline Curves)回归\
R语言泊松Poisson回归模型剖析案例\
在R语言中实现Logistic逻辑回归\
R语言用多项式回归和ARIMA模型预测电力负荷工夫序列数据\
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测\
R语言机器学习实战之多项式回归\
R语言自适应平滑样条回归剖析\
R语言区间数据回归剖析\
R语言逻辑回归和泊松回归模型对产生交通事故概率建模R语言线性回归和工夫序列剖析北京房价影响因素可视化案例\
R语言惩办logistic逻辑回归（LASSO,岭回归）高维变量抉择的分类模型案例\
R语言用规范最小二乘OLS，狭义相加模型GAM ，样条函数进行逻辑回归LOGISTIC分类\
R语言实现CNN（卷积神经网络）模型进行回归数据分析\
R语言中实现狭义相加模型GAM和一般最小二乘(OLS)回归\
R语言中应用非凸惩办函数回归(SCAD、MCP)剖析前列腺数据\
【视频】R语言实现CNN（卷积神经网络）模型进行回归数据分析\
R语言ISLR工资数据进行多项式回归和样条回归剖析\
R语言中的多项式回归、部分回归、核平滑和平滑样条回归模型\
R语言随机搜寻变量抉择SSVS预计贝叶斯向量自回归（BVAR）模型\
R语言如何和何时应用glmnet岭回归\
R语言基于线性回归的资本资产定价模型（CAPM）\
Matlab马尔可夫区制转换动静回归模型预计GDP增长率\
R语言MCMC:Metropolis-Hastings采样用于回归的贝叶斯预计

关于数据挖掘:R语言面板平滑转换回归PSTR分析案例实现附代码数据

全文下载链接： http://tecdat.cn/?p=3765

数据

初始化

预计

评估

可视化

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于数据挖掘:R语言面板平滑转换回归PSTR分析案例实现附代码数据

全文下载链接： http://tecdat.cn/?p=3765

数据

初始化

预计

评估

可视化

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复