关于算法:R语言估计多元标记的潜过程混合效应模型LCMM分析心理测试的认知过程

54次阅读

共计 3032 个字符,预计需要花费 8 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=24172 

背景和定义

每个动静景象都能够用一个潜过程(Λ(t))来表征,这个潜过程在间断的工夫 t 中演变。有时,这个潜过程是通过几个标记来掂量的,因而潜过程是它们的独特因素。

多元标记的潜过程混合模型

Proust-Lima 等人引入了潜在过程混合模型。(2006 – A Nonlinear Model with Latent Process for Cognitive Evolution Using Multivariate Longitudinal Data – Proust – 2006 – Biometrics – Wiley Online Library 和 2013 – Analysis of multivariate mixed longitudinal data: A flexible latent process approach – Proust‐Lima – 2013 – British Journal of Mathematical and Statistical Psychology – Wiley Online Library).

应用线性混合模型依据工夫对定义为潜过程的感兴趣量进行建模:

其中:

  • X(t) 和 Z(t) 是协变量的向量(Z(t) 蕴含在 X(t) 中;
  • β 是固定效应(即总体均匀效应);
  • ui 是随机效应(即个体效应);它们依据具备协方差矩阵 B 的零均值多元正态分布进行散布;
  • (wi(t)) 是一个高斯过程。

依据工夫和协变量的 Λ(t) 构造模型与单变量状况完全相同。

当初,咱们不再定义一个察看方程,而是定义 K 个不同标记的 K 个察看方程,其中 Yijk 是对主体 i、标记 k 和场合 j 的察看。在单变量状况下,能够通过定义特定于标记的链接函数 Hk 来解决几种类型的标记。特定于标记的察看方程还可能包含协变量上的一些比照 γk 以及标记和主体特定的随机截距:

 

其中:

  • αik~N(0,σ2k)
  • Xcijk 协变量向量
  • γk 是比照(k 上的总和等于 0)
  • tijk 对象 i、标记 k 和场合 j 的测量工夫;
  • ϵijk 一个独立的高斯误差,均值为 0,方差为 σ2ϵkσϵk2;
  • Hk 将潜过程转换为标记 k 的尺度和度量的链接函数(由 ηk 参数化)。

目前只思考间断链接函数。这些与单变量状况(在 lcmm 中)雷同。H−1 是一组递增枯燥函数的参数族:

  • 线性变换:这简化为线性混合模型(2 个参数)
  • Beta 累积散布族从新调整(4 个参数)
  • 具备 m 个节点的二次 I 样条的基(m+2 个参数)

可识别性

与任何潜在变量模型一样,必须定义潜在变量的度量。这里第一个随机效应 ui 的方差设置为 1,均匀截距(在 β 中)设置为 0。

认知过程示例

在这个例子中,当认知被定义为三种心理测试的独特因素时,咱们钻研了认知随工夫变动的轨迹:MMSE、BVRT 和 IST。这里的时间尺度是进入队列后的年数,轨迹被假设为工夫上的二次方(在集体和人群层面),模型被调整为进入时的年龄。为了进一步钻研性别的影响,包含对独特因素的均匀效应和对每个标记的差别效应(比照)(在这个例子中不与工夫相互作用)。

模型思考:

其中:

 是布朗过程, 对于 k = 1,2,3: 和 

不同链接函数的预计

咱们首先创立变量标准化,防止数值问题:

 

tie <- (ae - ag_it)/10

ag75 <- (ae_it - 75)/10

线性链接函数

默认状况下,所有链接函数都设置为线性:

mlmm(ubc'ID', dt = pud, radom = T, cr =B(tme))

非线性链接函数

依据数据的性质,可能须要一些非线性链接函数。例如,这里的 MMSE 是高度偏斜的:

hist(MMSE)

在单变量状况下,能够思考 Beta CDF 或样条。链接函数族能够对所有标记都雷同(即便参数不同):

 

# 以 Beta 为例
mlmm(lnk = 'beta')

或者能够不同地抉择链接函数。例如,

 

# 样条曲线中不同数量的结点

mlmm(lik = c('eta','3-uan-spes','3-antpln'))

修复一些转换参数

请留神,样条变换有时可能波及十分靠近 0 的参数,从而导致无奈收敛(因为参数位于参数空间的边界)。这常常产生在 MMSE 中。例如,在上面的示例中,因为 MMSE 变换的第三个参数低于 10e-4,因而不容易达到收敛。

 

# 样条曲线

mlmm(axe=50, ink = c('3asin'))

通过应用 fix 选项修复此参数,能够轻松解决此问题。为此,能够从预计向量(此处为第 21 个参数)中辨认参数的地位:

best

并且能够依据这些估计值和新固定的参数从新拟合模型:

 

# 样条曲线

mult(B=mp$best)

有了这个束缚,模型就能够正确收敛。

模型比拟

mult 对象是多元潜在过程混合模型,它们假如潜过程的轨迹完全相同,但链接函数不同。在单变量状况下,能够应用信息规范来比拟模型。该 summary 给咱们这样的信息。

 

sumrtbe(ml)

波及 Beta 变换和样条变换的模型在 AIC 方面仿佛比显示偏离正态性的线性变换要好得多。

能够在模型之间绘制和比拟转换:

 

par(mrow=c(1,1))


plot(llnes2, col = c(ol\[2\],ol\[3\]ol4\]), ld =1,ly=4)

除了线性变换,所有的预计变换都十分靠近。

后拟合输入

预计的链接函数:

链接函数的置信区间能够通过蒙特卡罗办法取得:

 predict(ml_btapl)

plt(Cl)

概括

该模型的摘要包含收敛性、拟合优度规范和预计参数。

summary

 

从预计后果来看,根底认知随着工夫的推移有一个二次方的轨迹,基线时年龄较大的受试者的认知程度系统地较低。依据性别没有差别。然而,性别对心理测试有显著的差异性影响(P=0.0003),男性的 BVRT 系统性较高,女性的 IST 程度较高。

方差解释

对于多元数据,潜在过程是不同标记的独特潜在因素。因而,咱们能够计算解释潜在过程的每个标记的残差方差。解释的这种方差取决于协变量并在特定工夫计算。

 

VarE(tbsp,dtafme(tme=0))

例如,公因子解释了 42% 的 MMSE 残差变动,而它解释了工夫 0 时 26% 的 BVRT 残差变动。

标记的预测轨迹图

能够依据协变量散布计算标记的预测轨迹,而后绘制。

predct(btapl,nwdta=dtew,va.tim='ime')


plt(prec_we, ld=c(1)

拟合优度:残差图

与任何混合模型一样,咱们心愿特定主题的残差(右下图)是高斯分布的。

 

plt(mlep, 0.8)

拟合优度:预测与察看的关系图

能够依据工夫绘制均匀预测和察看后果。请留神,预测和察看是在潜过程的范畴内(察看被转换为预计的链接函数):

plot(beal, whch="fit", time="ti")


 

最受欢迎的见解

1. 基于 R 语言的 lmer 混合线性回归模型

2.R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)

3.R 语言线性混合效应模型实战案例

4.R 语言线性混合效应模型实战案例 2

5.R 语言线性混合效应模型实战案例

6. 线性混合效应模型 Linear Mixed-Effects Models 的局部折叠 Gibbs 采样

7.R 语言 LME4 混合效应模型钻研老师的受欢迎水平

8.R 语言中基于混合数据抽样 (MIDAS) 回归的 HAR-RV 模型预测 GDP 增长回归的 HAR-RV 模型预测 GDP 增长 ”)

9. 应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM

正文完
 0