关于数据挖掘:使用SASStataHLMRSPSS和Mplus的多层线性模型HLM

原文链接：http://tecdat.cn/?p=10809

原文出处：拓端数据部落公众号

简介

本文档用于比拟六个不同统计软件程序（SAS，Stata，HLM，R，SPSS和Mplus）的两级多层（也称分层或档次）线性模型的过程和输入。

上面介绍的六个模型都是两级分层模型的变体，也称为多级模型，这是混合模型的非凡状况。此比拟仅对齐全嵌套的数据无效（不适用于穿插或其余设计的数据，能够应用混合模型进行剖析）。只管HLM软件的网站申明能够用于穿插设计，但这尚未失去确认。上面的SAS，Stata，R，SPSS和Mplus中应用的过程是其多层次或混合模型过程的一部分，并且能够扩大为非嵌套数据。

然而出于比拟的目标，咱们将仅钻研齐全嵌套的数据集。除了HLM（齐全由GUI运行）以外，所有程序的上面都蕴含用于每个模型的代码/语法。咱们提供了HLM和SPSS的屏幕截图。此外，每个模型均以分层格局和混合格局指定。只管模型的这两个表达式是等效的，但一些钻研畛域更偏向于可视化层次结构，因为它更容易看到档次之间的拆散，而另一些钻研畛域则更喜爱混合格局，在其中容易辨别固定成果和随机成果。

模型注意事项将预测变量增加到本文档探讨的六个模型中时，咱们抉择以均值居中为核心，这意味着咱们从每个受试者的得分中减去了该变量的总体均值。

正如Enders＆Tofighi（2007）所具体探讨的那样，以总体平均值为核心，而不是以组平均值（每个组的平均值均以该组中受试者的得分为准）为核心，并不适宜所有模型。。应用哪种居中办法的抉择应由所询问的具体钻研问题决定。另一个思考因素是这些程序应用的预计办法来产生参数估计，即最大似然（ML）或受限最大似然（REML）。每种都有本人的长处和毛病。ML更适宜不均衡的数据，然而会产生偏差的后果。REML是无偏的，然而在将两个嵌套模型与似然比测验进行比拟时，不能应用REML。

两种办法将产生雷同的固定效应预计，但它们对随机效应的预计却有所不同（Albright＆Marinova，2010）。正如咱们将在上面探讨的模型中看到的那样，这两种办法产生的后果十分类似，并且不会极大地影响随机因素的p值。然而，重要的是要意识到，办法的抉择会影响随机因素的预计，标准误差和p值，并且可能会影响发表随机因素是否重要的决策。SAS，HLM，R和SPSS默认应用REML，而Stata和Mplus应用ML。在本文档中的Stata示例中，咱们通知Stata应用REML以便将输入与其余四个程序进行比拟。

类内相关系数

咱们还报告了每种模型的类内相关系数（ICC）。ICC是后果变量中方差的比例，由分层模型的分组构造解释。它是依据组级别误差方差与总误差方差之比来计算的：

其中，是2级残差的方差，是1级残差的方差。换句话说，与总的无法解释的方差（方差之内和之间）相比，ICC报告了模型中任何可归因于分组变量的预测变量无法解释的变动量。

示例数据集

风行的数据集由来自不同班级的学生组成，并且因为每个学生都属于一个惟一的班级，因而它是一个嵌套设计。因变量是“风行”，它是一个自评的风行度，范畴为0-10。预测指标包含学生级别的性别（二分法）和Extrav（间断的自我评估的内向得分），以及班级的Texp（多年的老师教训，是间断的）。

仅截距模型（无条件模型）

无条件混合模型标准相似于单因素方差分析，其总体均值和类效应。然而，咱们将其视为随机效应（均值为零的正态分布变量），而不是像方差分析中那样的固定因子效应。因而，咱们将估计值解释为每个类别的平均数在总体均匀人气得分左近的方差。

估算值是每个班级的“公众”平均值的平均值，而不是钻研中所有学生的平均值。如果数据齐全均衡（即每个班级的学生人数雷同），则无条件模型的后果将与方差分析程序的后果雷同。

SAS后果

须要“ covtest”选项来报告方差重量预计的标准误差。另外，须要指定非结构化协方差矩阵类型，这是HLM和R默认状况下应用的类型，咱们在这里应用它进行比拟。SAS的输入等于Hox的书表2.1中的后果。咱们能够得出结论，各类别之间的均匀人气得分为5.078，并且各类别之间的差别（1.221）比不同类别之间的差别（0.702）多。当咱们为该模型计算ICC时，将对此进行进一步探讨。

Stata后果

Stata的xtmixed命令须要因变量，后跟“ ||” 指定固定变量和随机变量之间的分隔。咱们必须包含方差选项以查看输入中方差重量的估计值，以及reml选项以应用受限的最大似然预计。还要留神，Stata不会输入随机重量预计的p值，然而能够通过置信区间中是否蕴含零来确定有效值。这些后果与SAS的后果齐全匹配

HLM后果

HLM报告方差组件的标准偏差，而不是标准误差。同样，对于随机效应，他仅报告截距的卡方统计量和p值。这些后果与其余程序的后果雷同。

R后果

R报告方差成分（例如HLM）的标准偏差，而lme4软件包报告固定效应的t统计量。

SPSS后果

屏幕截图：

须要在“随机”窗口中指定非结构化协方差类型。这些后果与其余程序和本文得出的后果雷同。请留神，像SAS和Mplus一样，SPSS报告方差重量的标准误差，而HLM和R报告标准差。咱们无奈得出结论，哪个更适宜报告，然而差别不会影响这些参数的p值。

因为这是一个无条件模型，所以咱们不须要指定任何WITHIN或BETWEEN变量。上面列出了在MODEL语句中列出变量的规范。在以下各节中，咱们将看到前三个示例：

1.％WITHIN％– 1级固定因子（非随机斜率）2.具备潜在斜率变量的％WITHIN％– 1级随机因子3.％BETWEEN％– 2级固定因子4.在任一个陈说–在学生程度上测得的变量，但具备1级和2级方差预计。

上表显示了Mplus输入底部的“模型后果”局部的后果。Mplus的确会报告每个预计的p值，并且所有预计都与其余程序的p值匹配，但随机截距的方差预计相差约0.007。这种差别是因为Mplus应用ML预计这一事实造成的。只管存在这种差别，但咱们看不到任何变量的重要性发生变化。

汇总

总体而言，这六个程序对于仅截取模型产生了十分类似的后果（惟一的差别产生在随机效应的Mplus预计中）。惟一的区别是他们如何报告随机方差预计的精度。此模型的ICC等于：

这通知咱们，“风行”课程总变动的大概三分之一能够由每个学生所在的班级解释。

具备一个固定的Level-1因子的随机截距（非随机斜率）模型

该模型减少了一个学生级别的固定因子Extrav，即自我报告的内向得分。混合模型看起来像是基于带有协变量Extrav的类的ANCOVA，但请记住，咱们依然认为这是随机效应，而不是固定效应。因而，估算值与ANCOVA程序所得出的估算值不同。

在此数据的理论利用中，Extrav应该具备固定的成果而不是随机的成果是没有意义的，因为学生内向性的程度应随班级而变动。然而，出于比拟这四个程序的目标，咱们依然心愿考察一个具备一个学生级别固定因子的案例。

SAS后果

当初，咱们对Extrav的固定成果进行了估算。学生报告的内向得分每减少一个单位，他们的受欢迎度得分就会减少0.486。这些后果等于应用REML的其余程序的后果。

Stata后果

当咱们向Stata中的模型增加预测变量时，咱们增加了cov（un）选项，指定了非结构化协方差矩阵。咱们将 Extraversion变量放在“ ||”之前示意它是一个固定因子（具备非随机斜率）。这些后果与其余程序的后果雷同。

HLM后果

R后果

SPSS后果

Mplus后果

当初，咱们在VARIABLE语句的WITHIN选项中包含居中的Extrav变量。对于外部MODEL标准，咱们必须应用“ ON”选项，以告知Mplus Extrav是固定的1级因子。能够看到因为应用ML预计而不是REML，许多预计和预计的标准误差（以及t统计量）存在轻微差别。因为方差的估计值与其余程序不同，因而Mplus报告的ICC与上面报告的有所不同。

汇总

对于此模型，前五个程序的后果完全相同，而Mplus的估算值相差很小。此模型的ICC大于无条件模型的ICC（正如预期的那样，因为咱们通过增加固定因子来管制某些学生程度的变动）：

应用一个学生程度的固定因子，“风行”总变动的简直一半能够由该学生的班级和学生程度的固定因子“内向”解释

一个一级因子的随机截距和斜率模型

该模型蕴含Extrav的随机斜率，这意味着咱们容许回归方程的斜率随类而变动。该模型比以前的模型更适宜于所应用的变量，因为能够直观地假如内向因类而异。

SAS后果

随机Extrav斜率的估计值很重要（p值为0.003），因而咱们能够说学生的内向性得分随班级的不同而变动。这些后果与其余程序的后果齐全匹配，除了固定成果的t统计量存在一些轻微差别。

Stata后果

HLM后果

SPSS后果

Mplus后果

这次咱们在WITHIN语句中包含一个潜在的斜率变量，以将Extrav指定为随机因子，该变量通知Mplus不要在数据集中寻找“ randoms1”，因为没有察看到它。能够将此变量的输入解释为Extrav的随机斜率重量。咱们必须这样做，因为Mplus是为构造方程模型设计的，其多级模型性能是其潜在埋伏分析程序的改编。

汇总

总体而言，前五个程序对该模型产生雷同的后果，而Mplus再次因为ML预计而相差很小。此模型的ICC为：

通过将Extrav的影响从固定变为随机，因为咱们正在思考在学生级别上更多随机变动，因而ICC会略有减少。

两个1级因子的随机斜率模型

对于此模型，咱们包含第二个学生级别的变量Sex，该变量也具备随机斜率。这意味着咱们既要思考学生的性别，又要思考他们的内向得分，并且容许这两个因素的斜率随班级而变动。

SAS后果

在此输入中，咱们能够看到性别的确对学生自我报告的知名度有重大影响（p值<0.001）。对Sex的固定预计意味着，在Extrav不变的状况下，女学生（Sex = 1）的广泛得分比男学生（基线组，Sex = 0）高1.244。

SAS不喜爱在该模型中，Sex的预计方差十分靠近零，因而没有输入标准误差或p值。因为十分接近于零，所以咱们能够得出结论，性别不会因类别而显着变动。

Stata后果

Stata在运行该模型时援用了一个谬误：标准误差计算失败，这意味着未计算随机效应的标准误差。咱们发现通过删除cov（un）选项，不会呈现此谬误。然而，该输入中的所有预计均与其余程序不同，因而咱们抉择应用非结构化协方差矩阵标准报告输入。咱们不确定这是否是在Stata中运行此类模型的常见问题，但重要的是要意识到它会产生。

HLM后果

这些预计大抵等于其余打算的后果，但随机性别影响的预计除外。因为这种影响十分接近于零，因而程序不会报告完全相同的值，然而所有后果都表明该值远非重要。

R后果

SPSS后果

Mplus后果

这次，咱们在WITHIN语句中包含了两个潜在的斜率变量，以将Extrav和Sex指定为随机因子。咱们能够将“ randoms1”的输入解释为Extrav的预计，将“ randoms2”的输入解释为Sex的预计。

Mplus针对此模型的输入所得出的估计值与先前模型中的其余程序相距甚远。咱们看到，因为模型必须预计更多随机参数，因而预计程序（ML与REML）之间的差别变得更加显著。然而，Mplus批准其余程序的观点，即“性别”的随机方差局部以外的所有估计值都十分重要。

汇总

对于方差十分靠近零的随机效应，六个程序以不同的形式解决估计值。SAS和Stata无奈报告随机效应的标准误差或p值，而其余变量的估计值和标准误差均具备相当大的差别。Mplus后果也显示出比以前的模型更大的差别。此模型的ICC为：

同样，当咱们在模型中增加另一个学生级别的成果（包含随机斜率）时，ICC略有减少。

一个2级因子和两个随机1级因子（无交互）

这是咱们看到的第一个具备2级（班级）变量的模型：老师的多年教训（Texp），也是以均值为核心的。正如Enders和Tofighi（2007）指出的那样，级别2变量的惟一居中选项是均值居中。无奈对均值核心Texp进行分组，因为它曾经在班级程度上进行了度量，这意味着“分组均值”将等于原始值。

在分层格局中，能够看到它具备固定的斜率系数，并且对于每个类j都是惟一的。该模型在老师的教训和学生程度的变量之间没有任何相互作用。如果咱们有理由置信Texp不会弛缓Sex和Extrav对Popular的影响，那么咱们将应用此模型，这意味着咱们的学生程度变量的斜率是雷同的，无论学生是否有新老师或新老师。一位领有多年教训的人。

SAS后果

当初，咱们在固定成果表中看到了Texp，估计值为0.089，p值很大。这意味着，在使学生的性别和性取向得分放弃不变的状况下，每减少一年的老师教训，该学生的热门得分就会减少0.089。

同样，咱们看到SAS无奈解决随机性别效应的很小变动。因而，没有报告标准误差，z统计量或p值。

Stata后果

与以前的模型一样，咱们收到一个谬误，通知咱们Stata无奈计算方差重量的标准误差。然而，这些估计值与其余程序的估计值大致相同。

HLM后果

这些估计值与其余程序的后果略有不同。

R后果

SPSS后果

Mplus后果

对于Level-2因子，咱们在BETWEEN语句中包含Ctexp。咱们再次看到这些估计数与其余五个打算的输入有渺小出入

汇总

应用REML的五个程序的输入本质上是相等的，仅相差几千个单位。与以前的模型一样，最大的差别呈现在随机性别效应的方差预计中，因为它十分靠近零。

请留神，此模型的ICC比以前的模型有所升高（= 0.542）：

请记住，ICC是掂量所在的班级能够解释多少无法解释的变动的办法。通过增加班级级别的预测变量，咱们能够解释不同班级中较大比例的变动。因而，与没有任何2级预测变量的模型相比，该模型的随机截距存在较少的变异，因而ICC也较低。

具备相互作用的一个2级因子和两个随机1级因子

这是咱们在班级变量Texp与学生级变量Sex和Extrav之间进行跨级交互的惟一模型。例如，如果咱们想找出具备更多教训的老师是否比新老师对学生的内向性或性别与他们自我报告的知名度之间的关系有不同的影响，则能够应用此模型。换句话说，老师的经验是否适度了性格外向或性别对受欢迎水平的影响？

能够看到，在分层格局中，Texp在三个方程式的每个方程式内都有一个斜率系数。这与混合模型中的交互项无关，即通过内向的老师体验和按性别的老师体验。

SAS后果

在固定成果表中，有两个交互作用项，其中一个（）远不重要，p值> 0.5。

在随机方差重量表中，咱们看到内向随机斜率的估计值和性别随机斜率的估计值与零没有显着差别。这意味着没有证据表明这两个因素实际上在该模型中因类别而异。

Stata后果

Stata无奈自动识别变量之间的交互项，因而咱们必须为两个跨级别的交互手动创立变量（请参见下面的代码中的gen语句）。当咱们应用带有非结构化协方差矩阵选项的xtmixed命令运行时，Stata给出了一个谬误，指出Hessian不是负半定性，一致性谬误，并且没有产生任何输入。

HLM后果

这些估计值大抵等于其余程序的后果。

R后果

SPSS后果

对于SPSS 19而言，此模型切实太多了。对于具备非结构化协方差矩阵的更简单的模型，其余程序可能会运行更无效的算法，因而优于SPSS。

Mplus后果

当初，咱们在BETWEEN模型局部中蕴含两个ON语句，以批示与老师教训的跨档次交互。同样，咱们发现与其余输入之间的轻微差别，但Mplus批准Texp和Sex之间的固定交互作用不显着，而Extrav和Sex的随机组成也并不重要。

汇总

加上两个跨层交互项，Stata和SPSS无奈应用非结构化协方差选项运行模型。这并不是说不应该将它们用于这种类型的剖析，然而在向具备非结构化协方差矩阵的模型中增加更简单的参数时，应审慎应用。

与以前的模型一样，SAS，HLM和R的后果绝对靠近相等，而Mplus的预计略有不同。另外，ICC与模型5简直完全相同，这意味着交互作用项不会扭转按类别阐明的差别比例：

总结

进行比拟的目标是考察来自六个不同统计软件程序的嵌套两级层次模型的过程和后果可能存在的差别。总体而言，咱们发现SAS，Stata（带有reml选项），HLM，R和SPSS产生的理论估计值之间没有太大差别。Mplus应用另一种估算办法ML，这导致其估算值与其余估算值有所不同。另外，重要的是要留神以下几点：

1.对于方差预计十分靠近零的随机效应，SAS无奈产生标准误差或p值。其余三个程序在预计这些参数方面的差别与其余成果相比更大。

2. Stata和SPSS无奈解决最简单的模型，该模型蕴含两个跨级别的交互项。倡议应用其余程序来剖析简单模型并指定非结构化协方差矩阵。

此外，咱们钻研了每种模型中类内相关系数的值。通过增加1级预测因子，ICC有所增加。然而，当咱们增加2级预测变量时，ICC会大大降低，甚至比无条件模型更低。这是因为在类级别增加了预测变量时，无法解释的Level-2变异（随机截距项）缩小了。

只管本文档能够用作为嵌套数据集运行各种两级分层模型的指南，但咱们强烈建议读者仅在适宜答复您的特定钻研问题时应用这些模型。在确定固定因素和随机因素之间，以及对于核心平均值为1的总体平均值或组平均值时，必须审慎应用。

参考文献

Enders, Craig K. and Tofighi, Davood (2007). “Centering Predictor Variables in Cross-Sectional Multilevel Models: A New Look at an Old Issue.” Psychological Methods, vol. 12, pg. 121-138.

Hox, Joop J. (2010). Multilevel Analysis (2nd ed.). New York: Routledge

最受欢迎的见解

1.用SPSS预计HLM档次线性模型模型

2.R语言线性判别分析（LDA），二次判别分析（QDA）和正则判别分析（RDA）

3.基于R语言的lmer混合线性回归模型

4.R语言Gibbs抽样的贝叶斯简略线性回归仿真剖析

5.在r语言中应用GAM（狭义相加模型）进行电力负荷工夫序列剖析

6.应用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM

7.R语言中的岭回归、套索回归、主成分回归：线性模型抉择和正则化

8.R语言用线性回归模型预测空气质量臭氧数据

9.R语言分层线性模型案例