关于数据挖掘:R语言估计多元标记的潜过程混合效应模型lcmm分析心理测试的认知过程附代码数据

40次阅读

共计 3709 个字符,预计需要花费 10 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=24172 

最近咱们被客户要求撰写对于潜过程混合效应模型(lcmm)的钻研报告,包含一些图形和统计输入。

每个动静景象都能够用一个潜过程(Λ(t))来表征,这个潜过程在间断的工夫 t 中演变。有时,这个潜过程是通过几个标记来掂量的,因而潜过程是它们的独特因素。

多元标记的潜过程混合模型

Proust-Lima 等人引入了潜在过程混合模型。(2006 – A Nonlinear Model with Latent Process for Cognitive Evolution Using Multivariate Longitudinal Data – Proust – 2006 – Biometrics – Wiley Online Library 和 2013 – Analysis of multivariate mixed longitudinal data: A flexible latent process approach – Proust‐Lima – 2013 – British Journal of Mathematical and Statistical Psychology – Wiley Online Library).

应用线性混合模型依据工夫对定义为潜过程的感兴趣量进行建模:

其中:

  • X(t) 和 Z(t) 是协变量的向量(Z(t) 蕴含在 X(t) 中;
  • β 是固定效应(即总体均匀效应);
  • ui 是随机效应(即个体效应);它们依据具备协方差矩阵 B 的零均值多元正态分布进行散布;
  • (wi(t)) 是一个高斯过程。

依据工夫和协变量的 Λ(t) 构造模型与单变量状况完全相同。

当初,咱们不再定义一个察看方程,而是定义 K 个不同标记的 K 个察看方程,其中 Yijk 是对主体 i、标记 k 和场合 j 的察看。在单变量状况下,能够通过定义特定于标记的链接函数 Hk 来解决几种类型的标记。特定于标记的察看方程还可能包含协变量上的一些比照 γk 以及标记和主体特定的随机截距:

其中:

  • αik~N(0,σ2k)
  • Xcijk 协变量向量
  • γk 是比照(k 上的总和等于 0)
  • tijk 对象 i、标记 k 和场合 j 的测量工夫;
  • ϵijk 一个独立的高斯误差,均值为 0,方差为 σ2ϵkσϵk2;
  • Hk 将潜过程转换为标记 k 的尺度和度量的链接函数(由 ηk 参数化)。

目前只思考间断链接函数。这些与单变量状况(在 lcmm 中)雷同。H−1 是一组递增枯燥函数的参数族:

  • 线性变换:这简化为线性混合模型(2 个参数)
  • Beta 累积散布族从新调整(4 个参数)
  • 具备 m 个节点的二次 I 样条的基(m+2 个参数)

可识别性

与任何潜在变量模型一样,必须定义潜在变量的度量。这里第一个随机效应 ui 的方差设置为 1,均匀截距(在 β 中)设置为 0。

认知过程示例

在这个例子中,当认知被定义为三种心理测试的独特因素时,咱们钻研了认知随工夫变动的轨迹:MMSE、BVRT 和 IST。这里的时间尺度是进入队列后的年数,轨迹被假设为工夫上的二次方(在集体和人群层面),模型被调整为进入时的年龄。为了进一步钻研性别的影响,包含对独特因素的均匀效应和对每个标记的差别效应(比照)(在这个例子中不与工夫相互作用)。

模型思考:

其中:

和 ,  是布朗过程,对于 k = 1,2,3:,  和 

不同链接函数的预计

咱们首先创立变量标准化,防止数值问题:

 

tie <- (ae - ag_it)/10

ag75 <- (ae_it - 75)/10

线性链接函数

默认状况下,所有链接函数都设置为线性:

mlmm(ubc'ID', dt = pud, radom = T, cr =B(tme))

非线性链接函数

依据数据的性质,可能须要一些非线性链接函数。例如,这里的 MMSE 是高度偏斜的:

hist(MMSE)


点击题目查阅往期内容

R 语言如何用潜类别混合效应模型(LCMM)剖析抑郁症状

左右滑动查看更多

01

02

03

04

在单变量状况下,能够思考 Beta CDF 或样条。链接函数族能够对所有标记都雷同(即便参数不同):

 

# 以 Beta 为例
mlmm(lnk = 'beta')

或者能够不同地抉择链接函数。例如,

 

# 样条曲线中不同数量的结点

mlmm(lik = c('eta','3-uan-spes','3-antpln'))

修复一些转换参数

请留神,样条变换有时可能波及十分靠近 0 的参数,从而导致无奈收敛(因为参数位于参数空间的边界)。这常常产生在 MMSE 中。例如,在上面的示例中,因为 MMSE 变换的第三个参数低于 10e-4,因而不容易达到收敛。

 

# 样条曲线

mlmm(axe=50, ink = c('3asin'))

通过应用 fix 选项修复此参数,能够轻松解决此问题。为此,能够从预计向量(此处为第 21 个参数)中辨认参数的地位:

best

并且能够依据这些估计值和新固定的参数从新拟合模型:

 

# 样条曲线

mult(B=mp$best)

有了这个束缚,模型就能够正确收敛。

模型比拟

mult 对象是多元潜在过程混合模型,它们假如潜过程的轨迹完全相同,但链接函数不同。在单变量状况下,能够应用信息规范来比拟模型。该 summary 给咱们这样的信息。

 

sumrtbe(ml)

波及 Beta 变换和样条变换的模型在 AIC 方面仿佛比显示偏离正态性的线性变换要好得多。

能够在模型之间绘制和比拟转换:

 

par(mrow=c(1,1))


plot(llnes2, col = c(ol[2],ol[3]ol4]), ld =1,ly=4)

除了线性变换,所有的预计变换都十分靠近。

后拟合输入

预计的链接函数:

链接函数的置信区间能够通过蒙特卡罗办法取得:

 predict(ml_btapl)

plt(Cl)

概括

该模型的摘要包含收敛性、拟合优度规范和预计参数。

summary

从预计后果来看,根底认知随着工夫的推移有一个二次方的轨迹,基线时年龄较大的受试者的认知程度系统地较低。依据性别没有差别。然而,性别对心理测试有显著的差异性影响(P=0.0003),男性的 BVRT 系统性较高,女性的 IST 程度较高。

方差解释

对于多元数据,潜在过程是不同标记的独特潜在因素。因而,咱们能够计算解释潜在过程的每个标记的残差方差。解释的这种方差取决于协变量并在特定工夫计算。

 

VarE(tbsp,dtafme(tme=0))

例如,公因子解释了 42% 的 MMSE 残差变动,而它解释了工夫 0 时 26% 的 BVRT 残差变动。

标记的预测轨迹图

能够依据协变量散布计算标记的预测轨迹,而后绘制。

predct(btapl,nwdta=dtew,va.tim='ime')


plt(prec_we, ld=c(1)

拟合优度:残差图

与任何混合模型一样,咱们心愿特定主题的残差(右下图)是高斯分布的。

 

plt(mlep, 0.8)

拟合优度:预测与察看的关系图

能够依据工夫绘制均匀预测和察看后果。请留神,预测和察看是在潜过程的范畴内(察看被转换为预计的链接函数):

plot(beal, whch="fit", time="ti")


 

点击文末 “浏览原文”

获取全文残缺代码数据资料。

本文选自《R 语言预计多元标记的潜过程混合效应模型(lcmm)剖析心理测试的认知过程》。

点击题目查阅往期内容

R 语言因子实验设计 nlme 拟合非线性混合模型剖析有机农业施氮程度
R 语言非线性混合效应 NLME 模型 (固定效应 & 随机效应) 反抗哮喘药物茶碱动力学钻研
R 语言用线性混合效应(多程度 / 档次 / 嵌套)模型剖析腔调高下与礼貌态度的关系
R 语言 LME4 混合效应模型钻研老师的受欢迎水平 R 语言 nlme、nlmer、lme4 用(非)线性混合模型 non-linear mixed model 剖析藻类数据实例
R 语言混合线性模型、多层次模型、回归模型剖析学生均匀问题 GPA 和可视化
R 语言线性混合效应模型(固定效应 & 随机效应)和交互可视化 3 案例
R 语言用 lme4 多层次(混合效应)狭义线性模型(GLM),逻辑回归剖析教育留级考察数据 R 语言 线性混合效应模型实战案例
R 语言混合效应逻辑回归(mixed effects logistic)模型剖析肺癌数据
R 语言如何用潜类别混合效应模型(LCMM)剖析抑郁症状
R 语言基于 copula 的贝叶斯分层混合模型的诊断准确性钻研
R 语言建设和可视化混合效应模型 mixed effect model
R 语言 LME4 混合效应模型钻研老师的受欢迎水平
R 语言 线性混合效应模型实战案例
R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)
R 语言基于 copula 的贝叶斯分层混合模型的诊断准确性钻研
R 语言如何解决线性混合模型中畸形拟合 (Singular fit) 的问题
基于 R 语言的 lmer 混合线性回归模型
R 语言用 WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型
R 语言分层线性模型案例
R 语言用 WinBUGS 软件对学术能力测验(SAT)建设分层模型
应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM
R 语言用 WinBUGS 软件对学术能力测验建设档次(分层)贝叶斯模型
SPSS 中的多层(等级)线性模型 Multilevel linear models 钻研整容手术数据
用 SPSS 预计 HLM 多层(档次)线性模型模型

正文完
 0