原文链接:http://tecdat.cn/?p=10809
原文出处:拓端数据部落公众号
简介
本文档用于比拟六个不同统计软件程序(SAS,Stata,HLM,R,SPSS 和 Mplus)的两级多层(也称分层或档次)线性模型的过程和输入。
上面介绍的六个模型都是两级分层模型的变体,也称为多级模型,这是混合模型的非凡状况。此比拟仅对齐全嵌套的数据无效(不适用于穿插或其余设计的数据,能够应用混合模型进行剖析)。只管 HLM 软件的网站申明能够用于穿插设计,但这尚未失去确认。上面的 SAS,Stata,R,SPSS 和 Mplus 中应用的过程是其多层次或混合模型过程的一部分,并且能够扩大为非嵌套数据。
然而出于比拟的目标,咱们将仅钻研齐全嵌套的数据集。除了 HLM(齐全由 GUI 运行)以外,所有程序的上面都蕴含用于每个模型的代码 / 语法。咱们提供了 HLM 和 SPSS 的屏幕截图。此外,每个模型均以分层格局和混合格局指定。只管模型的这两个表达式是等效的,但一些钻研畛域更偏向于可视化层次结构,因为它更容易看到档次之间的拆散,而另一些钻研畛域则更喜爱混合格局,在其中容易辨别固定成果和随机成果。
模型注意事项将预测变量增加到本文档探讨的六个模型中时,咱们抉择以均值居中为核心,这意味着咱们从每个受试者的得分中减去了该变量的总体均值。
正如 Enders&Tofighi(2007)所具体探讨的那样,以总体平均值为核心,而不是以组平均值(每个组的平均值均以该组中受试者的得分为准)为核心,并不适宜所有模型。。应用哪种居中办法的抉择应由所询问的具体钻研问题决定。另一个思考因素是这些程序应用的预计办法来产生参数估计,即最大似然(ML)或受限最大似然(REML)。每种都有本人的长处和毛病。ML 更适宜不均衡的数据,然而会产生偏差的后果。REML 是无偏的,然而在将两个嵌套模型与似然比测验进行比拟时,不能应用 REML。
两种办法将产生雷同的固定效应预计,但它们对随机效应的预计却有所不同(Albright&Marinova,2010)。正如咱们将在上面探讨的模型中看到的那样,这两种办法产生的后果十分类似,并且不会极大地影响随机因素的 p 值。然而,重要的是要意识到,办法的抉择会影响随机因素的预计,标准误差和 p 值,并且可能会影响发表随机因素是否重要的决策。SAS,HLM,R 和 SPSS 默认应用 REML,而 Stata 和 Mplus 应用 ML。在本文档中的 Stata 示例中,咱们通知 Stata 应用 REML 以便将输入与其余四个程序进行比拟。
类内相关系数
咱们还报告了每种模型的类内相关系数(ICC)ρ。ICC 是后果变量中方差的比例,由分层模型的分组构造解释。它是依据组级别误差方差与总误差方差之比来计算的:
其中,是 2 级残差的方差,是 1 级残差的方差。换句话说,与总的无法解释的方差(方差之内和之间)相比,ICC 报告了模型中任何可归因于分组变量的预测变量无法解释的变动量。
示例数据集
风行的数据集由来自不同班级的学生组成,并且因为每个学生都属于一个惟一的班级,因而它是一个嵌套设计。因变量是“风行”,它是一个自评的风行度,范畴为 0 -10。预测指标包含学生级别的性别(二分法)和 Extrav(间断的自我评估的内向得分),以及班级的 Texp(多年的老师教训,是间断的)。
仅截距模型(无条件模型)
无条件混合模型标准相似于单因素方差分析,其总体均值和类效应。然而,咱们将其视为随机效应(均值为零的正态分布变量),而不是像方差分析中那样的固定因子效应。因而,咱们将估计值解释为每个类别的平均数在总体均匀人气得分左近的方差。
估算值是每个班级的“公众”平均值的平均值,而不是钻研中所有学生的平均值。如果数据齐全均衡(即每个班级的学生人数雷同),则无条件模型的后果将与方差分析程序的后果雷同。
SAS 后果
须要“covtest”选项来报告方差重量预计的标准误差。另外,须要指定非结构化协方差矩阵类型,这是 HLM 和 R 默认状况下应用的类型,咱们在这里应用它进行比拟。SAS 的输入等于 Hox 的书表 2.1 中的后果。咱们能够得出结论,各类别之间的均匀人气得分为 5.078,并且各类别之间的差别(1.221)比不同类别之间的差别(0.702)多。当咱们为该模型计算 ICC 时,将对此进行进一步探讨。
Stata 后果
Stata 的 xtmixed 命令须要因变量,后跟“||”指定固定变量和随机变量之间的分隔。咱们必须包含方差选项以查看输入中方差重量的估计值,以及 reml 选项以应用受限的最大似然预计。还要留神,Stata 不会输入随机重量预计的 p 值,然而能够通过置信区间中是否蕴含零来确定有效值。这些后果与 SAS 的后果齐全匹配
HLM 后果
HLM 报告方差组件的标准偏差,而不是标准误差。同样,对于随机效应,他 仅报告截距的卡方统计量和 p 值。这些后果与其余程序的后果雷同。
R 后果
R 报告方差成分(例如 HLM)的标准偏差,而 lme4 软件包报告固定效应的 t 统计量。
SPSS 后果
屏幕截图:
须要在“随机”窗口中指定非结构化协方差类型。这些后果与其余程序和本文得出的后果雷同。请留神,像 SAS 和 Mplus 一样,SPSS 报告方差重量的标准误差,而 HLM 和 R 报告标准差。咱们无奈得出结论,哪个更适宜报告,然而差别不会影响这些参数的 p 值。
因为这是一个无条件模型,所以咱们不须要指定任何 WITHIN 或 BETWEEN 变量。上面列出了在 MODEL 语句中列出变量的规范。在以下各节中,咱们将看到前三个示例:
1.%WITHIN%– 1 级固定因子(非随机斜率)2. 具备潜在斜率变量的%WITHIN%– 1 级随机因子 3.%BETWEEN%– 2 级固定因子 4. 在任一个陈说–在学生程度上测得的变量,但具备 1 级和 2 级方差预计。
上表显示了 Mplus 输入底部的“模型后果”局部的后果。Mplus 的确会报告每个预计的 p 值,并且所有预计都与其余程序的 p 值匹配,但随机截距的方差预计相差约 0.007。这种差别是因为 Mplus 应用 ML 预计这一事实造成的。只管存在这种差别,但咱们看不到任何变量的重要性发生变化。
汇总
总体而言,这六个程序对于仅截取模型产生了十分类似的后果(惟一的差别产生在随机效应的 Mplus 预计中)。惟一的区别是他们如何报告随机方差预计的精度。此模型的 ICC 等于:
这通知咱们,“风行”课程总变动的大概三分之一能够由每个学生所在的班级解释。
具备一个固定的 Level- 1 因子的随机截距(非随机斜率)模型
该模型减少了一个学生级别的固定因子 Extrav,即自我报告的内向得分。混合模型看起来像是基于带有协变量 Extrav 的类的 ANCOVA,但请记住,咱们依然认为这是随机效应,而不是固定效应。因而,估算值与 ANCOVA 程序所得出的估算值不同。
在此数据的理论利用中,Extrav 应该具备固定的成果而不是随机的成果是没有意义的,因为学生内向性的程度应随班级而变动。然而,出于比拟这四个程序的目标,咱们依然心愿考察一个具备一个学生级别固定因子的案例。
SAS 后果
当初,咱们对 Extrav 的固定成果进行了估算。学生报告的内向得分每减少一个单位,他们的受欢迎度得分就会减少 0.486。这些后果等于应用 REML 的其余程序的后果。
Stata 后果
当咱们向 Stata 中的模型增加预测变量时,咱们增加了 cov(un)选项,指定了非结构化协方差矩阵。咱们将 Extraversion 变量放在“||”之前 示意它是一个固定因子(具备非随机斜率)。这些后果与其余程序的后果雷同。
HLM 后果
R 后果
SPSS 后果
Mplus 后果
当初,咱们在 VARIABLE 语句的 WITHIN 选项中包含居中的 Extrav 变量。对于外部 MODEL 标准,咱们必须应用“ON”选项,以告知 Mplus Extrav 是固定的 1 级因子。能够看到因为应用 ML 预计而不是 REML,许多预计和预计的标准误差(以及 t 统计量)存在轻微差别。因为方差的估计值与其余程序不同,因而 Mplus 报告的 ICC 与上面报告的有所不同。
汇总
对于此模型,前五个程序的后果完全相同,而 Mplus 的估算值相差很小。此模型的 ICC 大于无条件模型的 ICC(正如预期的那样,因为咱们通过增加固定因子来管制某些学生程度的变动):
应用一个学生程度的固定因子,“风行”总变动的简直一半能够由该学生的班级和学生程度的固定因子“内向”解释
一个一级因子的随机截距和斜率模型
该模型蕴含 Extrav 的随机斜率,这意味着咱们容许回归方程的斜率随类而变动。该模型比以前的模型更适宜于所应用的变量,因为能够直观地假如内向因类而异。
SAS 后果
随机 Extrav 斜率的估计值很重要(p 值为 0.003),因而咱们能够说学生的内向性得分随班级的不同而变动。这些后果与其余程序的后果齐全匹配,除了固定成果的 t 统计量存在一些轻微差别。
Stata 后果
HLM 后果
SPSS 后果
Mplus 后果
这次咱们在 WITHIN 语句中包含一个潜在的斜率变量,以将 Extrav 指定为随机因子,该变量通知 Mplus 不要在数据集中寻找“randoms1”,因为没有察看到它。能够将此变量的输入解释为 Extrav 的随机斜率重量。咱们必须这样做,因为 Mplus 是为构造方程模型设计的,其多级模型性能是其潜在埋伏分析程序的改编。
汇总
总体而言,前五个程序对该模型产生雷同的后果,而 Mplus 再次因为 ML 预计而相差很小。此模型的 ICC 为:
通过将 Extrav 的影响从固定变为随机,因为咱们正在思考在学生级别上更多随机变动,因而 ICC 会略有减少。
两个 1 级因子的随机斜率模型
对于此模型,咱们包含第二个学生级别的变量 Sex,该变量也具备随机斜率。这意味着咱们既要思考学生的性别,又要思考他们的内向得分,并且容许这两个因素的斜率随班级而变动。
SAS 后果
在此输入中,咱们能够看到性别的确对学生自我报告的知名度有重大影响(p 值 <0.001)。对 Sex 的固定预计意味着,在 Extrav 不变的状况下,女学生(Sex = 1)的广泛得分比男学生(基线组,Sex = 0)高 1.244。
SAS 不喜爱在该模型中,Sex 的预计方差十分靠近零,因而没有输入标准误差或 p 值。因为十分接近于零,所以咱们能够得出结论,性别不会因类别而显着变动。
Stata 后果
Stata 在运行该模型时援用了一个谬误:标准误差计算失败,这意味着未计算随机效应的标准误差。咱们发现通过删除 cov(un)选项,不会呈现此谬误。然而,该输入中的所有预计均与其余程序不同,因而咱们抉择应用非结构化协方差矩阵标准报告输入。咱们不确定这是否是在 Stata 中运行此类模型的常见问题,但重要的是要意识到它会产生。
HLM 后果
这些预计大抵等于其余打算的后果,但随机性别影响的预计除外。因为这种影响十分接近于零,因而程序不会报告完全相同的值,然而所有后果都表明该值远非重要。
R 后果
SPSS 后果
Mplus 后果
这次,咱们在 WITHIN 语句中包含了两个潜在的斜率变量,以将 Extrav 和 Sex 指定为随机因子。咱们能够将“randoms1”的输入解释为 Extrav 的预计,将“randoms2”的输入解释为 Sex 的预计。
Mplus 针对此模型的输入所得出的估计值与先前模型中的其余程序相距甚远。咱们看到,因为模型必须预计更多随机参数,因而预计程序(ML 与 REML)之间的差别变得更加显著。然而,Mplus 批准其余程序的观点,即“性别”的随机方差局部以外的所有估计值都十分重要。
汇总
对于方差十分靠近零的随机效应,六个程序以不同的形式解决估计值。SAS 和 Stata 无奈报告随机效应的标准误差或 p 值,而其余变量的估计值和标准误差均具备相当大的差别。Mplus 后果也显示出比以前的模型更大的差别。此模型的 ICC 为:
同样,当咱们在模型中增加另一个学生级别的成果(包含随机斜率)时,ICC 略有减少。
一个 2 级因子和两个随机 1 级因子(无交互)
这是咱们看到的第一个具备 2 级(班级)变量的模型:老师的多年教训(Texp),也是以均值为核心的。正如 Enders 和 Tofighi(2007)指出的那样,级别 2 变量的惟一居中选项是均值居中。无奈对均值核心 Texp 进行分组,因为它曾经在班级程度上进行了度量,这意味着“分组均值”将等于原始值。
在分层格局中,能够看到它具备固定的斜率系数,并且对于每个类 j 都是惟一的。该模型在老师的教训和学生程度的变量之间没有任何相互作用。如果咱们有理由置信 Texp 不会弛缓 Sex 和 Extrav 对 Popular 的影响,那么咱们将应用此模型,这意味着咱们的学生程度变量的斜率是雷同的,无论学生是否有新老师或新老师。一位领有多年教训的人。
SAS 后果
当初,咱们在固定成果表中看到了 Texp,估计值为 0.089,p 值很大。这意味着,在使学生的性别和性取向得分放弃不变的状况下,每减少一年的老师教训,该学生的热门得分就会减少 0.089。
同样,咱们看到 SAS 无奈解决随机性别效应的很小变动。因而,没有报告标准误差,z 统计量或 p 值。
Stata 后果
与以前的模型一样,咱们收到一个谬误,通知咱们 Stata 无奈计算方差重量的标准误差。然而,这些估计值与其余程序的估计值大致相同。
HLM 后果
这些估计值与其余程序的后果略有不同。
R 后果
SPSS 后果
Mplus 后果
对于 Level- 2 因子,咱们在 BETWEEN 语句中包含 Ctexp。咱们再次看到这些估计数与其余五个打算的输入有渺小出入
汇总
应用 REML 的五个程序的输入本质上是相等的,仅相差几千个单位。与以前的模型一样,最大的差别呈现在随机性别效应的方差预计中,因为它十分靠近零。
请留神,此模型的 ICC 比以前的模型有所升高(= 0.542):
请记住,ICC 是掂量 所在的班级能够解释多少无法解释的变动的办法。通过增加班级级别的预测变量,咱们能够解释不同班级中较大比例的变动。因而,与没有任何 2 级预测变量的模型相比,该模型的随机截距存在较少的变异,因而 ICC 也较低。
具备相互作用的一个 2 级因子和两个随机 1 级因子
这是咱们在班级变量 Texp 与学生级变量 Sex 和 Extrav 之间进行跨级交互的惟一模型。例如,如果咱们想找出具备更多教训的老师是否比新老师对学生的内向性或性别与他们自我报告的知名度之间的关系有不同的影响,则能够应用此模型。换句话说,老师的经验是否适度了性格外向或性别对受欢迎水平的影响?
能够看到,在分层格局中,Texp 在三个方程式的每个方程式内都有一个斜率系数。这与混合模型中的交互项无关,即通过内向的老师体验和按性别的老师体验。
SAS 后果
在固定成果表中,有两个交互作用项,其中一个()远不重要,p 值 > 0.5。
在随机方差重量表中,咱们看到内向随机斜率的估计值和性别随机斜率的估计值与零没有显着差别。这意味着没有证据表明这两个因素实际上在该模型中因类别而异。
Stata 后果
Stata 无奈自动识别变量之间的交互项,因而咱们必须为两个跨级别的交互手动创立变量(请参见下面的代码中的 gen 语句)。当咱们应用带有非结构化协方差矩阵选项的 xtmixed 命令运行时,Stata 给出了一个谬误,指出 Hessian 不是负半定性,一致性谬误,并且没有产生任何输入。
HLM 后果
这些估计值大抵等于其余程序的后果。
R 后果
SPSS 后果
对于 SPSS 19 而言,此模型切实太多了。对于具备非结构化协方差矩阵的更简单的模型,其余程序可能会运行更无效的算法,因而优于 SPSS。
Mplus 后果
当初,咱们在 BETWEEN 模型局部中蕴含两个 ON 语句,以批示与老师教训的跨档次交互。同样,咱们发现与其余输入之间的轻微差别,但 Mplus 批准 Texp 和 Sex 之间的固定交互作用不显着,而 Extrav 和 Sex 的随机组成也并不重要。
汇总
加上两个跨层交互项,Stata 和 SPSS 无奈应用非结构化协方差选项运行模型。这并不是说不应该将它们用于这种类型的剖析,然而在向具备非结构化协方差矩阵的模型中增加更简单的参数时,应审慎应用。
与以前的模型一样,SAS,HLM 和 R 的后果绝对靠近相等,而 Mplus 的预计略有不同。另外,ICC 与模型 5 简直完全相同,这意味着交互作用项不会扭转按类别阐明的差别比例:
总结
进行比拟的目标是考察来自六个不同统计软件程序的嵌套两级层次模型的过程和后果可能存在的差别。总体而言,咱们发现 SAS,Stata(带有 reml 选项),HLM,R 和 SPSS 产生的理论估计值之间没有太大差别。Mplus 应用另一种估算办法 ML,这导致其估算值与其余估算值有所不同。另外,重要的是要留神以下几点:
1. 对于方差预计十分靠近零的随机效应,SAS 无奈产生标准误差或 p 值。其余三个程序在预计这些参数方面的差别与其余成果相比更大。
2. Stata 和 SPSS 无奈解决最简单的模型,该模型蕴含两个跨级别的交互项。倡议应用其余程序来剖析简单模型并指定非结构化协方差矩阵。
此外,咱们钻研了每种模型中类内相关系数的值。通过增加 1 级预测因子,ICC 有所增加。然而,当咱们增加 2 级预测变量时,ICC 会大大降低,甚至比无条件模型更低。这是因为在类级别增加了预测变量时,无法解释的 Level- 2 变异(随机截距项)缩小了。
只管本文档能够用作为嵌套数据集运行各种两级分层模型的指南,但咱们强烈建议读者仅在适宜答复您的特定钻研问题时应用这些模型。在确定固定因素和随机因素之间,以及对于核心平均值为 1 的总体平均值或组平均值时,必须审慎应用。
参考文献
Enders, Craig K. and Tofighi, Davood (2007).“Centering Predictor Variables in Cross-Sectional Multilevel Models: A New Look at an Old Issue.”Psychological Methods, vol. 12, pg. 121-138.
Hox, Joop J. (2010). Multilevel Analysis (2nd ed.). New York: Routledge
最受欢迎的见解
1. 用 SPSS 预计 HLM 档次线性模型模型
2.R 语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)
3. 基于 R 语言的 lmer 混合线性回归模型
4.R 语言 Gibbs 抽样的贝叶斯简略线性回归仿真剖析
5. 在 r 语言中应用 GAM(狭义相加模型)进行电力负荷工夫序列剖析
6. 应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM
7.R 语言中的岭回归、套索回归、主成分回归:线性模型抉择和正则化
8.R 语言用线性回归模型预测空气质量臭氧数据
9.R 语言分层线性模型案例