关于机器学习:SPSS中的多层等级线性模型Multilevel-linear-models研究整容手术数据

40次阅读

共计 4072 个字符,预计需要花费 11 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=12761


咱们应用整容手术数据阐明两种中心化类型。将此文件加载到 SPSS 中。假如咱们要中心化的变量 BDI。

数据中心化

首先,咱们须要找出 BDI 的均匀得分。咱们能够应用一些简略的描述性统计信息。抉择进入对话框。抉择 BDI 并将其拖到标有 Variable(s)的框中,而后单击并仅抉择均值。

后果输入通知咱们平均值为 23.05:

咱们应用此值将变量中心化。通过抉择拜访计算命令。在呈现的对话框中,在标有“指标变量”的框中输出名称 BDI_Centred,而后单击并为变量指定一个更具描述性的名称。抉择变量 BDI 并将其拖动到标记为 Numeric Expression 的区域,而后单击,而后键入平均值(23.05)。实现的对话框如图所示。

单击,将创立一个名为 BDI_Centred 的新变量,该变量以 BDI 的平均值为核心。这个新变量的均值应约为 0:运行一些描述性统计数据。

能够在语法窗口中通过输出以下内容执行雷同的操作:

COMPUTE BDI_Centred = BDI−23.05.
EXECUTE.

组均值中心化

组均值中心化要简单得多。第一步是创立一个蕴含组均值的文件。让咱们再试一次以获取 BDI 分数。咱们心愿将此变量在 Clinic 的 2 级变量中中心化。咱们首先须要晓得每个组中的均匀 BDI,并以 SPSS 模式保留该信息。咱们要应用 aggregate 命令。在此对话框(图 3)中,咱们要抉择 Clinic 并将其拖动到标有 Break Variable(s)的区域。这阐明着将应用变量 Clinic 来宰割数据文件(换句话说,当计算平均值时,它将对每个诊所别离进行解决)。而后,咱们须要抉择 BDI 并将其拖动到标记为变量汇总的区域。一旦抉择了此变量,默认值就是 SPSS 将创立一个名为 BDI_mean 的新变量,这是 BDI 的平均值(显然是由 Clinic 宰割)。咱们须要将此信息保留在一个文件中,以便当前应用。

默认状况下,SPSS 会将名称为 aggr.sav 的文件保留在默认目录中。如果您想将其保留在其余地位或应用其余名称,则单击以关上一个一般的文件系统对话框,能够在其中命名文件并导航至要保留在其中的目录。单击创立此新文件。

如果关上生成的数据文件,则会看到它仅蕴含两列,其中一列带有一个数字,用于指定数据来自的诊所(共有 10 个诊所),第二个蕴含每个诊所内的均匀 BDI 得分。

当 SPSS 创立汇总数据文件时,它将按从最低到最高的程序对诊所进行排序(无论它们在数据集中的程序如何)。因而,为了使咱们的工作数据文件与该聚合文件匹配,咱们须要确保从诊所 1 到诊所 10 也订购了来自各个诊所的所有数据。这能够通过应用 sort cases 命令轻松实现。

要拜访 sort cases 命令,请抉择 select。呈现的对话框如图所示。抉择您要对文件进行排序的变量(在本例中为 Clinic),并将其拖动到标有“排序根据”的区域(或单击)。能够抉择按升序排列文件(诊所 1 到诊所 10),或降序排列(返回诊所 1 的诊所 10)。单击对文件排序。

下一步是在汇总文件中应用这些临床办法,以将 BDI 变量放在咱们的主文件中。为此,咱们须要应用 match files 命令,能够通过抉择进行拜访。这将关上一个对话框,其中列出了所有关上的数据文件(在我的状况下,除了我正在工作的文件之外,其余所有文件都没有关上,因而该空间为空白)或询问您抉择 SPSS 数据文件。单击并导航到您决定存储聚合值文件的地位(在我的状况下为 aggr.sav)。抉择此文件,而后单击以返回到对话框。而后单击进入下一个对话框。

在下一个对话框中,咱们须要匹配两个文件,这只是通知 SPSS 两个文件已连贯。为此,请单击。而后,咱们还须要专门连贯 Clinic 变量上的文件。为此,select 通知 SPSS 有效的数据集(即,汇总分数文件)应视为与要害变量上的工作数据文件匹配的值表。咱们须要抉择此要害变量是什么。咱们要匹配 Clinic 变量上的文件,因而在“排除的变量”列表中抉择此变量,并将其拖到标有“要害变量”的空间(或单击)。

 数据编辑器当初应蕴含一个新变量 BDI\_mean,其中蕴含咱们文件 aggr.sav 中的值。基本上,SPSS 已匹配诊所变量的文件,因而 BDI\_mean 中的值对应于各个诊所的平均值。因而,当临床变量为 1 时,BDI\_mean 已设置为 25.19,然而当临床变量为 2 时,BDI\_mean 已设置为 31.32。咱们能够再次在 compute 命令中应用这些值来使 BDI 中心化。通过抉择拜访计算命令。在呈现的对话框(图 7)中,在标有“指标变量”的框中输出名称 BDI\_Group\_Centred,而后单击并为变量指定一个更具描述性的名称。抉择变量 BDI 并将其拖到标有“数字表达式”的区域,而后单击,而后键入“BDI_mean”或抉择此变量并将其拖到标有“指标变量”的框中。单击,将创立一个新变量,其中蕴含以组为核心的均值。

另外,能够应用以下语法来实现所有操作:

AGGREGATE
 /OUTFILE='C:\\Users\\Dr. Andy Field\\Documents\\Academic\\Data\\aggr.sav'
 /BREAK=Clinic
 /BDI_mean=MEAN(BDI).
SORT CASES BY Clinic(A).
MATCH FILES /FILE=*
 /TABLE='C:\\Users\\Dr. Andy Field\\Documents\\Academic\\Data\\aggr.sav'
 /BY Clinic.
EXECUTE.
COMPUTE BDI\_Group\_Centred=BDI − BDI_mean.
EXECUTE.

要拜访“重组数据向导”,请抉择。向导中的步骤如图所示。在第一个对话框中,您须要说是否要将变量转换为案例,还是将案例转换为变量。咱们在不同的列(变量)中具备不同的工夫级别,并且心愿它们在不同的行(案例)中,因而咱们须要抉择。单击以移至下一个对话框。该对话框询问您是要从旧数据文件的不同列中在新数据文件中仅创立一个新变量,还是要创立多个新变量。

在咱们的案例中,咱们将创立一个代表生存满意度的变量。默认,SPSS 在新数据文件中创立一个名为 id 的变量,该变量告诉您数据来自哪个样本(即原始数据文件的哪一行)。它通过应用原始数据文件中的案例编号来实现。而后从数据文件中抉择一个变量以充当新数据文件中的标签。

其余对话框非常简单。接下来的两个解决索引变量。SPSS 创立一个新变量,该变量将通知你数据源自哪一列。在咱们有四个工夫点的状况下,这将意味着变量只是一个从 1 到 4 的数字序列。

多层(等级)线性模型

将 BDI,年龄和性别包含在内作为固定成果预测指标。

抉择,而后通过从变量列表中抉择 Clinic 并将其拖动到标有 Subjects 的框中来指定 变量(或单击)。

单击以移至主对话框。首先,咱们必须指定后果变量,即手术后的生存品质(QoL),因而抉择 Post_QoL 并将其拖动到标有因变量的空间(或单击)。

咱们须要将预测变量作为固定效应增加到咱们的模型中,因而单击,按住 Ctrl 并在标记为 Factors 和 Covariates 的列表中抉择 Base_QoL,Surgery,Age,性别,Reason 和 BDI。

当初,咱们须要申请随机截距和随机斜率以达到手术成果。

单击并抉择。单击以返回到主对话框。在主对话框中,单击并申请参数估计和协方差参数的测验。单击以返回到主对话框。要运行剖析。输入如下:

就此新模型的整体拟合而言,咱们能够应用对数似然统计:

卡方统计的临界值为 7.81(p <.05,df = 3);因而,这一变动意义重大。包含这三个预测变量能够改善模型的拟合度。年龄,F(1,150.83)= 37.32,p <.001,BDI,F(1,260.83)= 16.74,p <.001,显着预测了手术后的生存品质,但性别没有,F(1,264.48)= 0.90,p = 0.34。包含这些因素的次要区别在于,Reason 的次要影响变得不显着,并且 Reason×Surgery 交互作用变得更加重要(其 b 从 4.22,p = .013 变为 5.02,p = .001)。

咱们能够通过拆分并运行更简略的剖析来合成此交互,如本文所述(没有交互和 Reason 的次要影响,但包含 Base_QoL,Surgery,BDI,Age 和 Gender)。如果进行这些剖析,将取得输入中所示的参数表。对于那些只为扭转外观而进行手术的患者,手术显着预测了手术后的生存品质,b = –3.16,t(5.25)= –2.63,p = .04。与不包含年龄,性别和 BDI 的状况不同,这种影响当初很显著。负系数表明,与对照组相比,这些人的手术后生存品质较低。然而,对于那些通过手术解决身材问题的人,手术并不能显着预测生存品质,b = 0.67,t(10.59)= 0.58,p = 0.57。从实质上讲,年龄,性别和 BDI 的纳入对后一组简直没有什么影响。然而,该斜率是正的,表明承受手术医治的人的生存品质得分比等待名单上的得分高(只管不是很显著!)。因而,相互作用的影响反映了在进行身材问题手术的患者(轻微的正斜率)和仅出于虚荣心进行手术的患者(负的斜率)中手术斜率作为生存品质预测指标的差别。

扭转外貌的手术

身材问题的手术


最受欢迎的见解

1. 基于 R 语言的 lmer 混合线性回归模型

2.R 语言用 Rshiny 摸索 lme4 狭义线性混合模型(GLMM)和线性混合模型(LMM)

3.R 语言线性混合效应模型实战案例

4.R 语言线性混合效应模型实战案例 2

5.R 语言线性混合效应模型实战案例

6. 线性混合效应模型 Linear Mixed-Effects Models 的局部折叠 Gibbs 采样

7.R 语言 LME4 混合效应模型钻研老师的受欢迎水平

8.R 语言中基于混合数据抽样 (MIDAS) 回归的 HAR-RV 模型预测 GDP 增长

9. 应用 SAS,Stata,HLM,R,SPSS 和 Mplus 的分层线性模型 HLM

正文完
 0