原文链接:http://tecdat.cn/?p=12227

原文出处:拓端数据部落公众号


摘要

本文形容了R语言中马尔克夫转换模型的剖析过程。首先,对模仿数据集进行具体建模。接下来,将马尔可夫转换模型拟合到具备离散响应变量的实在数据集。用于验证对这些数据集建模的不同办法。

模仿实例

示例数据是一个模仿数据集,用于展现如何检测两种不同模式的存在:一种模式中的响应变量高度相干,另一种模式中的响应仅取决于外生变量x。自相干观测值的区间为1到100、151到180 和251到300。每种计划的实在模型为:

图1中的曲线表明,在不存在自相干的区间中,响应变量y具备与协变量x类似的行为。拟合线性模型以钻研协变量x如何解释变量响应y。
 

> summary(mod) Call:lm(formula = y ~ x, data = example)Residuals:      Min 1Q Median 3Q Max-2.8998 -0.8429 -0.0427 0.7420 4.0337> plot(ts(example))

图1:模仿数据,y变量是响应变量

Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept)    9.0486    0.1398    64.709    < 2e-16 ***x    0.8235    0.2423    3.398    0.00077 ***Residual standard error: 1.208 on 298 degrees of freedomMultiple R-squared: 0.03731, Adjusted R-squared: 0.03408F-statistic: 11.55 on 1 and 298 DF, p-value: 0.0007701

协变量的确很重要,然而模型解释的数据行为十分蹩脚。图1中的线性模型残差图表明,它们的自相干很强。残差的诊断图(图2)确认它们仿佛不是白噪声,并且具备自相干关系。接下来,将自回归马尔可夫转换模型(MSM-AR)拟合到数据。自回归局部设置为1。为了批示所有参数在两个周期中都能够不同,将转换参数(sw)设置为具备四个重量的矢量。拟合线性模型时的最初一个值称为残差。

 
标准偏差。有一些选项可管制估算过程,例如用于批示是否实现了过程并行化的逻辑参数。
 

Markov Switching ModelAIC    BIC    logLik637.0736 693.479 -312.5368Coefficients:Regime 1\-\-\-\-\-\-\-\-\-Estimate Std. Error t value    Pr(>|t|)(Intercept)(S)    0.8417    0.3025    2.7825    0.005394 **x(S)    -0.0533    0.1340 -0.3978    0.690778y_1(S)    0.9208    0.0306 30.0915 < 2.2e-16 ***\-\-\-Signif. codes:    0    '***' 0.001    '**' 0.01    '*' 0.05    '.' 0.1    ' ' 1Residual standard error: 0.5034675Multiple R-squared: 0.8375Standardized Residuals:Min    Q1    Med    Q3    Max-1.5153666657 -0.0906543311    0.0001873641    0.1656717256    1.2020898986Regime 2---------    Estimate Std. Error t value    Pr(>|t|)(Intercept)(S)    8.6393    0.7244 11.9261 < 2.2e-16 ***x(S)    1.8771    0.3107    6.0415 1.527e-09 ***y_1(S)    -0.0569    0.0797 -0.7139    0.4753\-\-\-Signif. codes:    0    '***' 0.001    '**' 0.01    '*' 0.05    '.' 0.1    ' ' 1Residual standard error: 0.9339683Multiple R-squared: 0.2408Standardized Residuals:Min Q1 Med Q3 Max-2.31102193 -0.03317756 0.01034139 0.04509105 2.85245598Transition probabilities:Regime 1 Regime 2Regime 1 0.98499728 0.02290884Regime 2 0.01500272 0.97709116

模型mod.mswm具备协方差x十分显着的状态,而在其余状况下,自相干变量也十分重要。两者的R平方均具备较高的值。最初,转移概率矩阵具备较高的值,这表明很难从接通状态更改为另一个状态。该模型能够完满地检测每个状态的周期。残差看起来像是白噪声,它们适宜正态分布。而且,自相干隐没了。

 

 图形显示已完满检测到每个计划的周期。

> plot(mod.mswm,expl="x")

交通事故

 

交通数据蕴含2010年西班牙交通事故的每日人数,均匀每日温度和每日降水量。该数据的目标是钻研死亡人数与气象条件之间的关系。因为在周末和工作日变量之间存在不同的行为,因而咱们阐明了在这种状况下应用狭义马尔科夫转换模型的状况。
在此示例中,响应变量是计数变量。因而,咱们拟合了泊松狭义线性模型。

> summary(model)Call:glm(formula = NDead ~ Temp + Prec, family = "poisson", data = traffic)

Deviance Residuals:Min    1Q    Median    3Q    Max-3.1571    -1.0676    -0.2119    0.8080    3.0629Coefficients:Estimate Std. Error z value Pr(>|z|)(Intercept) 1.1638122 0.0808726 14.391 < 2e-16 ***Temp 0.0225513 0.0041964 5.374 7.7e-08 ***Prec 0.0002187 0.0001113 1.964 0.0495 *\-\-\-Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1(Dispersion parameter for poisson family taken to be 1)Null deviance: 597.03 on 364 degrees of freedomResidual deviance: 567.94 on 362 degrees of freedomAIC: 1755.9Number of Fisher Scoring iterations: 5

下一步,应用拟合马尔可夫转换模型。为了适应狭义马尔可夫转换模型,必须蕴含族参数,而且glm没有标准偏差参数,因而sw参数不蕴含其切换参数。

> Markov Switching ModelAIC    BIC    logLik1713.878 1772.676 -850.9388Coefficients:Regime 1\-\-\-\-\-\-\-\-\-Estimate Std. Error t value    Pr(>|t|)(Intercept)(S)    0.7649    0.1755    4.3584    1.31e-05 ***Temp(S)    0.0288    0.0082    3.5122 0.0004444 ***Prec(S)    0.0002    0.0002    1.0000 0.3173105\-\-\-Signif. codes:    0    '***' 0.001    '**' 0.01    '*' 0.05    '.' 0.1    ' ' 1Regime 2\-\-\-\-\-\-\-\-\-Estimate Std. Error t value Pr(>|t|)(Intercept)(S)    1.5659    0.1576    9.9359    < 2e-16 ***Temp(S)    0.0194    0.0080    2.4250    0.01531 *Prec(S)    0.0004    0.0002    2.0000    0.04550 *\-\-\-Signif. codes:    0    '***' 0.001    '**' 0.01    '*' 0.05    '.' 0.1    ' ' 1Transition probabilities:Regime 1 Regime 2Regime 1 0.7287732 0.4913893Regime 2 0.2712268 0.5086107

两种状态都有显着的协变量,但降水协变量仅在这两种状态之一中是显着的。

Aproximate intervals for the coefficients. Level= 0.95(Intercept):Lower Estimation UpperRegime 1 0.4208398 0.7648733 1.108907Regime 2 1.2569375 1.5658582 1.874779Temp:Lower Estimation UpperRegime 1 0.012728077 0.02884933 0.04497059Regime 2 0.003708441 0.01939770 0.03508696Prec:Lower Estimation UpperRegime 1 -1.832783e-04 0.0001846684 0.0005526152Regime 2 -4.808567e-05 0.0004106061 0.0008692979

 

 

因为模型是通用线性模型的扩大,因而从类对象计算出图中的Pearson残差。该残差有白噪声的经典构造。残差不是自相干的,但它们与正态分布不太吻合。然而,Pearson残差的正态性不是狭义线性模型验证的要害条件。

> plot(m1,which=2)

 

 

咱们能够看到短时间内的状态调配,因为较大的状态基本上蕴含工作日。


最受欢迎的见解

1.用R语言模仿混合制排队随机服务排队零碎

2.R语言中应用排队论预测等待时间

3.R语言中实现马尔可夫链蒙特卡罗MCMC模型

4.R语言中的马尔科夫机制转换(Markov regime switching)模型模型")

5.matlab贝叶斯隐马尔可夫hmm模型

6.用R语言模仿混合制排队随机服务排队零碎

7.Python基于粒子群优化的投资组合优化

8.R语言马尔可夫转换模型钻研交通伤亡人数事变预测

9.用机器学习辨认一直变动的股市情况——隐马尔可夫模型的利用