基于R语言的lmer混合线性回归模型

37次阅读

共计 847 个字符,预计需要花费 3 分钟才能阅读完成。

原文 http://tecdat.cn/?p=2596

混合模型适合需求吗?

混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对响应变量的影响。混合模型的输出将给出一个解释值列表,其效应值的估计值和置信区间,每个效应的 p 值以及模型拟合程度的至少一个度量。如果您有一个变量将您的数据样本描述为您可能收集的数据的子集,则应该使用混合模型而不是简单的线性模型。

什么概率分布最适合数据?

假设你已经决定要运行混合模型。接下来你要做的是找到最适合你的数据的概率分布。

#lnorm 表示对数正态 qqp(recog $ Aggression.t,“lnorm”)

#qqp 要求估计负二项式,泊松#和伽玛分布的参数。可以使用 fitdistr #函数生成估计值。

查看我使用 qqp 生成的图。y 轴表示观察值,x 轴表示由分布模拟的分位数。红色的实线表示完美的分布拟合,虚线的红色线条表示完美的分布拟合的置信区间。

如何将混合模型拟合到数据

数据是正常分布的

如果你的数据是正态分布的,你可以使用线性混合模型(LMM)。您将需要加载 lme4 软件包并调用 lmer 函数。

如果你的数据不正常分布

用于估计模型中效应大小的 REML 和最大似然方法会对数据不适用正态性假设,因此您必须使用不同的方法进行参数估计。

结束:了解你的数据

在熟悉数据之前,您无法真正了解哪些分析适合您的数据,熟悉这些数据的最佳方法是绘制它们。通常我的第一步是做我感兴趣的变量的密度图,按照我最感兴趣的解释变量来分解。

绘图对评估模型拟合也很重要。通过以各种方式绘制拟合值,您可以确定哪种模型适合描述数据

该图所做的是创建一条代表零的水平虚线:与最佳拟合线平均偏离零。

结果正如我所希望的那样:与最佳拟合线的偏差趋于零。如果这条实线没有覆盖虚线,那意味着最适合的线条不太适合。

MCMC 模型图形比较

这些随机效果看起来非常尖锐,不像白色噪音。所以让我们尝试用更多的迭代来重新设计模型。这是计算量更大,但产生更准确的结果。

现在更接近线条周围的白色噪音,这意味着更好的模型。

正文完
 0