原文 http://tecdat.cn/?p=2596
混合模型适合需求吗?
混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对响应变量的影响。混合模型的输出将给出一个解释值列表,其效应值的估计值和置信区间,每个效应的 p 值以及模型拟合程度的至少一个度量。如果您有一个变量将您的数据样本描述为您可能收集的数据的子集,则应该使用混合模型而不是简单的线性模型。
什么概率分布最适合数据?
假设你已经决定要运行混合模型。接下来你要做的是找到最适合你的数据的概率分布。
#lnorm 表示对数正态 qqp(recog $ Aggression.t,“lnorm”)
#qqp 要求估计负二项式,泊松#和伽玛分布的参数。可以使用 fitdistr #函数生成估计值。
查看我使用 qqp 生成的图。y 轴表示观察值,x 轴表示由分布模拟的分位数。红色的实线表示完美的分布拟合,虚线的红色线条表示完美的分布拟合的置信区间。
如何将混合模型拟合到数据
数据是正常分布的
如果你的数据是正态分布的,你可以使用线性混合模型(LMM)。您将需要加载 lme4 软件包并调用 lmer 函数。
如果你的数据不正常分布
用于估计模型中效应大小的 REML 和最大似然方法会对数据不适用正态性假设,因此您必须使用不同的方法进行参数估计。
结束:了解你的数据
在熟悉数据之前,您无法真正了解哪些分析适合您的数据,熟悉这些数据的最佳方法是绘制它们。通常我的第一步是做我感兴趣的变量的密度图,按照我最感兴趣的解释变量来分解。
绘图对评估模型拟合也很重要。通过以各种方式绘制拟合值,您可以确定哪种模型适合描述数据
。
该图所做的是创建一条代表零的水平虚线:与最佳拟合线平均偏离零。
结果正如我所希望的那样:与最佳拟合线的偏差趋于零。如果这条实线没有覆盖虚线,那意味着最适合的线条不太适合。
MCMC 模型图形比较
这些随机效果看起来非常尖锐,不像白色噪音。所以让我们尝试用更多的迭代来重新设计模型。这是计算量更大,但产生更准确的结果。
现在更接近线条周围的白色噪音,这意味着更好的模型。