基于R语言的lmer混合线性回归模型

原文 http://tecdat.cn/?p=2596

混合模型适合需求吗？

混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对响应变量的影响。混合模型的输出将给出一个解释值列表，其效应值的估计值和置信区间，每个效应的 p 值以及模型拟合程度的至少一个度量。如果您有一个变量将您的数据样本描述为您可能收集的数据的子集，则应该使用混合模型而不是简单的线性模型。

什么概率分布最适合数据？

假设你已经决定要运行混合模型。接下来你要做的是找到最适合你的数据的概率分布。

#lnorm 表示对数正态 qqp（recog $ Aggression.t，“lnorm”）

#qqp 要求估计负二项式，泊松#和伽玛分布的参数。可以使用 fitdistr #函数生成估计值。

查看我使用 qqp 生成的图。y 轴表示观察值，x 轴表示由分布模拟的分位数。红色的实线表示完美的分布拟合，虚线的红色线条表示完美的分布拟合的置信区间。

如何将混合模型拟合到数据

数据是正常分布的

如果你的数据是正态分布的，你可以使用线性混合模型（LMM）。您将需要加载 lme4 软件包并调用 lmer 函数。

如果你的数据不正常分布

用于估计模型中效应大小的 REML 和最大似然方法会对数据不适用正态性假设，因此您必须使用不同的方法进行参数估计。

结束：了解你的数据

在熟悉数据之前，您无法真正了解哪些分析适合您的数据，熟悉这些数据的最佳方法是绘制它们。通常我的第一步是做我感兴趣的变量的密度图，按照我最感兴趣的解释变量来分解。

绘图对评估模型拟合也很重要。通过以各种方式绘制拟合值，您可以确定哪种模型适合描述数据

。

该图所做的是创建一条代表零的水平虚线：与最佳拟合线平均偏离零。

结果正如我所希望的那样：与最佳拟合线的偏差趋于零。如果这条实线没有覆盖虚线，那意味着最适合的线条不太适合。

MCMC 模型图形比较

这些随机效果看起来非常尖锐，不像白色噪音。所以让我们尝试用更多的迭代来重新设计模型。这是计算量更大，但产生更准确的结果。

现在更接近线条周围的白色噪音，这意味着更好的模型。