关于数据挖掘:拓端tecdatR语言用Rshiny探索lme4广义线性混合模型GLMM和线性混合模型LMM

1次阅读

共计 3238 个字符,预计需要花费 9 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=3138

原文出处:拓端数据部落公众号

随着 软件 包的提高,应用狭义线性混合模型(GLMM)和线性混合模型(LMM)变得越来越容易。因为咱们发现自己在工作中越来越多地应用这些模型,咱们开发了一套 R shiny 工具来简化和减速与对象交互的 lme4 常见工作。

相干视频:线性混合效应模型 (LMM,Linear Mixed Models) 和 R 语言实现

线性混合效应模型 (LMM,Linear Mixed Models) 和 R 语言实现案例

时长 12:13

shiny 的应用程序和演示

演示此应用程序性能的最简略办法是应用 Shiny 应用程序,在此处启动一些指标以帮忙摸索模型。

在第一个选项卡上,该函数显示用户抉择的数据的预测区间。该函数通过从固定效应和随机效应项的模仿散布中抽样并组合这些模仿预计来疾速计算预测区间,以产生每个察看的预测散布。

在下一个选项卡上,固定效应和组级成果的散布在置信区间图上显示。这些对于诊断十分有用,并提供了查看各种参数的绝对大小的办法。

在第三个标签上有一些不便的办法,显示成果的影响或水平predictInterval。对于每种状况,最多 12 个,在所选数据类型中,用户能够查看更改固定效应的影响。这容许用户比拟变量之间的成果大小,以及雷同数据之间的模型之间的成果大小。

预测

预测像这样。

predict(m1, newdata

#>        1        2        3        4        5        6        7        8

#> 3.146336 3.165211 3.398499 3.114248 3.320686 3.252670 4.180896 3.845218

#>        9       10

#> 3.779336 3.331012

预测 lmglm

predInte(m1, newdata = Eval\[1:10, \], n.sims = 500, level = 0.9,

#>         fit      lwr      upr

#> 1  3.074148 1.112255 4.903116

#> 2  3.243587 1.271725 5.200187

#> 3  3.529055 1.409372 5.304214

#> 4  3.072788 1.079944 5.142912

#> 5  3.395598 1.268169 5.327549

#> 6  3.262092 1.333713 5.304931

预测区间 较慢,因为它是模拟计算。

可视化

可视化查看对象的性能。最简略的是失去固定和随机效应参数的后验散布。

head(Sim)

#>          term        mean      median         sd

#> 1 (Intercept)  3.22673524  3.22793168 0.01798444

#> 2    service1 -0.07331857 -0.07482390 0.01304097

#> 3   lectage.L -0.18419526 -0.18451731 0.01726253

#> 4   lectage.Q  0.02287717  0.02187172 0.01328641

#> 5   lectage.C -0.02282755 -0.02117014 0.01324410

咱们能够这样绘制:

pltsim(sim(m1, n.sims = 100), level = 0.9, stat = 'median'

咱们还能够疾速制作随机效应的图:

head(Sims)

#>   groupFctr groupID        term        mean      median        sd

#> 1         s       1 (Intercept)  0.15317316  0.11665654 0.3255914

#> 2         s       2 (Intercept) -0.08744824 -0.03964493 0.2940082

#> 3         s       3 (Intercept)  0.29063126  0.30065450 0.2882751

#> 4         s       4 (Intercept)  0.26176515  0.26428522 0.2972536

#> 5         s       5 (Intercept)  0.06069458  0.06518977 0.3105805
plotR((m1, n.sims = 100), stat = 'median', sd = TRUE

有时,随机效应可能难以解释

 Rank(m1, groupFctr = "d")

head(ranks)

#>      d (Intercept) (Intercept)_var       ER pctER

#> 1 1866   1.2553613     0.012755634 1123.806   100

#> 2 1258   1.1674852     0.034291228 1115.766    99

#> 3  240   1.0933372     0.008761218 1115.090    99

#> 4   79   1.0998653     0.023095979 1112.315    99

#> 5  676   1.0169070     0.026562174 1101.553    98

#> 6   66   0.9568607     0.008602823 1098.049    97

成果模仿

解释 LMM 和 GLMM 模型的后果很艰难,尤其是不同参数对预测后果的绝对影响。

impact(m1, Eval\[7, \], groupFctr = "d", breaks = 5,

n.sims = 300, level = 0.9)



#>   case bin   AvgFit     AvgFitSE nobs

#> 1    1   1 2.787033 2.801368e-04  193

#> 2    1   2 3.260565 5.389196e-05  240

#> 3    1   3 3.561137 5.976653e-05  254

#> 4    1   4 3.840941 6.266748e-05  265

#> 5    1   5 4.235376 1.881360e-04  176

结果表明 yhat 依据咱们提供的 newdata 在组因子系数的大小方面,从第一个到第五个分位数的变动。

ggplot(impSim, aes(x = factor(bin), y = AvgFit, ymin = AvgFit - 1.96*AvgFitSE,

ymax = AvgFit + 1.96*AvgFitSE)) +

十分感谢您浏览本文,有任何问题请在上面留言!


最受欢迎的见解

1. 基于 R 语言的 lmer 混合线性回归模型

2.R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)

3.R 语言线性混合效应模型实战案例

4.R 语言线性混合效应模型实战案例 2

5.R 语言线性混合效应模型实战案例

6. 线性混合效应模型 Linear Mixed-Effects Models 的局部折叠 Gibbs 采样

7.R 语言 LME4 混合效应模型钻研老师的受欢迎水平

8.R 语言中基于混合数据抽样 (MIDAS) 回归的 HAR-RV 模型预测 GDP 增长回归的 HAR-RV 模型预测 GDP 增长 ”)

9. 应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM

正文完
 0