关于数据挖掘:R语言IRT理论扩展Rasch模型等级量表模型lltm-rsm-和-pcm模型分析心理和教育测验数据可视化

23次阅读

共计 4095 个字符,预计需要花费 11 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=26096 

摘要

咱们首先介绍扩大 Rasch 模型的方法论,而后是个别程序形容和利用主题, 包含简略的 Rasch 模型、评级量表模型、局部信用模型及其线性扩大。这种线性构造的联合容许对协变量的影响进行建模,并可能剖析反复的分类测量。

简介

Rost (1999) 在他的文章中宣称,“只管 Rasch 模型曾经存在了这么长时间,但目前 95% 的心理学测试依然是应用经典测试实践的办法构建的”。基本上,他援用了很少应用 Rasch 模型 (rm) 的以下起因:原始模式的 Rasch 模型 (Rasch 1960) 仅限于二分项,对于理论测试目标而言,能够说限制性太强。因而,钻研人员应该关注扩大的 Rasch 模型。

除了根本的 rm,能够计算的模型有:线性逻辑测验模型 (Scheiblechner 1972)、评级量表模型 (Andrich 1978)、线性评级量表模型 (Fischer and Parzer 1991)、局部信用模型(Masters 1982)和线性局部信用模型(Glas 和 Verhelst 1989;Fischer 和 Ponocny 1994)。

扩大 Rasch 模型

个别表白

Andersen (1995) 推导出以下示意,这些示意基于 Rasch 对多组数据的个别表达式。数据矩阵示意为 X,行中的人 v 和列中的我的项目 i。总共有 v = 1, …, n 集体和 i = 1, …, k 项。数据矩阵 X 中的单个元素示意为 xvi。此外,每个我的项目 i 都有肯定数量的响应类别,用 h = 0, …, mi 示意。对我的项目 i 的响应 h 的相应概率能够依据以下两个表达式导出(Andersen 1995):

或者

这里,φh 是我的项目参数的评分函数,θv 是一维人参数,βi 是我的项目参数。在等式 1 中,ωh 对应于类别参数,而在等式 2 中,βih 是我的项目类别参数。

扩大 Rasch 模型的示意

对于二分项的一般 Rasch 模型,等式 1 简化为

次要假如,也实用于本文提出的概括,是:潜在特色的单维性、原始分数的充分性、部分独立性和平行我的项目特色曲线 (iccs)。相应的解释能够在 Fischer (1974) 中找到,在 Fischer (1995a) 中能够找到数学推导和证实。

对于二分项,Scheiblechner (1972) 提出了(更受限制的)线性逻辑测验模型 (lltm),起初由 Fischer (1973) 形式化,通过将我的项目参数拆分为线性组合

请留神,我的项目 i 和操作 j 的权重 wij 必须先验地固定。对于认知操作的进一步论述能够在 Fischer (1974, p. 361ff.) 中找到。因而,从这个角度来看,lltm 比 Rasch 模型更简洁。

不过,还有另一种对待 lltm 的办法:根本 Rasch 模型在反复测量和组比照方面的概括。须要留神的是,两种类型的从新参数化也实用于线性评级量表模型(lrsm)和线性局部信用模型(lpcm),绝对于上面介绍的根本评级量表模型(rsm)和局部信用模型(pcm). 对于 lltm,Fischer (1974) 曾经介绍了将其用作 Rasch 模型的推广以进行反复测量的可能性。在随后的几年中,这一倡议失去了进一步的论述。

在这一点上,咱们将专一于 Rasch 模型的简略多分类推广,即 rsm (Andrich 1978),其中每个我的项目 Ii 必须具备雷同数量的类别。对于等式 1,能够将 φh 设置为 h,其中 h = 0, …, m。因为在 rsm 中我的项目类别的数量是恒定的,因而应用 m 而不是 mi。因而,由此得出 

具备 k 个我的项目参数 β1, …, βk 和 m + 1 个类别参数 ω0, …, ωm。此参数化导致对单个我的项目的响应类别 Ch 进行评分。我的项目参数能够像方程 4 中那样以线性组合进行拆分。

最初,介绍了 Masters (1982) 开发的 pcm 及其线性扩大 lpcm (Fischer and Ponocny 1994)。pcm 为 h = 0, …, mi 的每个 Ii ×Ch 组合调配一个参数 βih。因而,恒定评分属性不能保留项目,此外,我的项目能够具备不同数量的响应类别,由 mi 示意。因而,pcm 能够被视为 rsm 的推广,并且人 v 对类别 h(我的项目 i)的响应的概率定义为

很显著,(6) 是 (2) 在 φh = h 方面的简化。至于 lltm 和 lrsm,lpcm 是通过从新参数化根本模型的 item 参数来定义的,即

利用示例

在以下大节中,提供了与不同模型和设计矩阵场景相干的各种示例。因为可了解性问题,数据集放弃相当小。

示例 1:Rasch 模型

咱们从一个基于 100×30 数据矩阵的简略 Rasch 模型开始示例局部。首先,咱们预计我的项目参数,而后预计人员参数。

而后咱们应用 Andersen 的 LR 测验与均匀宰割规范进行拟合优度:

> lrre

咱们看到模型拟合,并且该后果的图形示意(仅我的项目子集)在图  中通过带有相信椭圆的拟合优度图给出。

> plotGOF(lrres.rasch, beta.subset = c(14, 5, 18, 7, 1), tlab = "item",
+ conf = list(ia = FALSE, col = "blue", lty = "dotted"))

为了可能绘制相信椭圆,须要在计算 LR 测试时设置 se = TRUE。

示例 2:lltm 作为受限 Rasch 模型

对我的项目参数进行线性扩大的模型也能够看作是其底层根本模型的特例。事实上,上面提出的 lltm 并遵循 Scheiblechner (1972) 的原始想法,是一个受限的 rm,即与 Rasch 模型相比,预计参数的数量更小。数据矩阵 X 由 n = 15 集体和 k = 5 个我的项目组成。此外,咱们指定具备特定权重元素 wij 的设计矩阵 W。

> retm <- LLTM(lt2, W)
> summary(resm)

summary 办法为基本参数和后果我的项目参数提供点估计和标准误差。请留神,我的项目参数始终依据等式 1 和 2 而不是 3 预计为容易度参数。

示例 3:rsm 和 pcm

同样,咱们当初提供一个人工数据集,其中 n = 300 人,k = 4 个我的项目;他们每个人都有 m + 1 = 3 个类别。咱们从 rsm 的预计开始,随后,咱们计算相应的类别穿插参数。

> thresholds(resm)

地位参数基本上是我的项目难度,阈值是图 4 中给出的 icc 图中类别曲线相交的点:

> plotICC(res.rsm, mplot = TRUE, legpos = FALSE, ask = FALSE)

rsm 将所有我的项目的阈值间隔限度为雷同。应用 pcm 能够放宽这个强假如。后果以人员 - 我的项目地图示意(参见图 5)。

> res.pcm <- PCM(pcmdat2)
> plotPImap(res.pcm, sorted = TRUE)

在预计人员参数后,咱们能够查看我的项目拟合统计信息。

itemfit(pcm)

 比拟 rsm 和 pcm 的似然比测验表明 pcm 提供了更好的拟合。

> pvalue <- 1 - pchisq(lr, df)

用于在不同组中反复测量的 lpcm

最简单的示例是指具备两个测量点的 lpcm。此外,对于医治是否无效的假如也很乏味。相应的比照是上面 W 中的最初一列。首先,指定数据矩阵 X。咱们假如一个由 k = 3 个我的项目组成的人工测试,该测试向受试者展现了两次。X 中的前 3 列对应于第一个测试场合,而后 3 列对应于第二个场合。通常,前 k 列对应于第一个测试场合,接下来的 k 列对应于第二个测试场合,依此类推。总共有 n = 20 个科目。其中,前 10 人属于第一组(如对照组),后 10 人属于第二组(如实验组)。这由组向量指定:

> grouplpcm <- rep(1:2, each = 10)

同样,W 是主动生成的。通常,对于此类设计,W 的生成首先包含我的项目比照,而后是工夫比照,最初是除第一个测量点之外的组主效应(因为可识别性问题,如前所述)。

> rm <- LPCM
> model.matrix

参数估计如下:

> coef

 

测验 η 参数是否等于 0 与那些波及我的项目的参数(在本例中为 η1,…,η8)简直无关。然而对于其余的比照,H0 : η9 = 0(意味着没有个别工夫效应)不能被回绝(p = .44),而假如 H0 : η10 = 0 在利用 z 时必须被回绝(p = .004)- 测验。这表明在测量点上存在显着的试验成果。如果用户想要执行额定的测验,例如两个 η 参数的等价性的 Wald 测验,能够利用 vcov 办法来取得方差 - 协方差矩阵。

探讨与瞻望

cml 预计办法与 em 算法相结合,也可用于预计混合 Rasch 模型 (MIRA)。这种模型背地的根本思维是扩大的 Rasch 模型实用于个体的亚群,但每个亚群具备不同的参数值。

在 Rasch 模型中,我的项目分别参数 αi 始终固定为 1,因而它不会呈现在根本方程中。2-pl 模型能够通过 ltm 包进行预计(Rizopoulos 2006)。然而,Verhelst 和 Glas (1995) 制订了单参数逻辑模型 (oplm),其中 αi 不会因我的项目而异,但不等于 1。预计 oplm 的根本策略是一个三步法:首先,计算 Rasch 模型的我的项目参数。而后,在肯定的限度条件下计算判断参数。最初,应用这些判断权重,oplm 的我的项目参数是应用 cml 预计的。这是 Rasch 模型在不同斜率方面更灵便的版本。

对不同数量的我的项目类别的概括、容许引入我的项目协变量和 / 或趋势的线性扩大以及可选的组比照是在测试中查看我的项目行为和集体体现时的重要问题。这进步了 irt 模型在各种应用领域的可行性。


最受欢迎的见解

1.R 语言多元 Logistic 逻辑回归 利用案例

2. 面板平滑转移回归 (PSTR) 剖析案例实现剖析案例实现 ”)

3.matlab 中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R 语言泊松 Poisson 回归模型剖析案例

5.R 语言混合效应逻辑回归 Logistic 模型剖析肺癌

6.r 语言中对 LASSO 回归,Ridge 岭回归和 Elastic Net 模型实现

7.R 语言逻辑回归、Naive Bayes 贝叶斯、决策树、随机森林算法预测心脏病

8.python 用线性回归预测股票价格

9.R 语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测

正文完
 0