原文链接:http://tecdat.cn/?p=23085
简介
本文对构造方程模型进行效力剖析。
本文从一些简略的例子开始。其余部分提供了一些对于统计背景的阐明,各种效应大小的定义,以及本包所含函数的详细描述。
背景介绍
数学模型的统计评估通常是通过思考测试统计量来进行的,测试统计量示意察看数据和拟合模型的数据之间的差别。在SEM中,大小为N的样本的相干测试统计量由T = F(N - 1)给出。F示意所选差别函数(如最大似然)的最小化样本值,从而表明模型与样本数据的不匹配。因而,T容许对模型正确的无效假设(H0)进行似然比测验。如果假如的模型在总体中成立,能够证实T在渐进上遵循核心 2(df)散布,df=.5-p(p+1)-q自由度,其中p是体现变量的数量,q示意自在参数的数量。这就是为什么T常常被称为 "卡方模型测验统计量"。
给出一个卡方测验统计量的察看值,能够进行一个无效假设的显著性测验。通常的测验过程如下。给定一个特定的-误差程度(通常是=0.05),从渐近核心 2(df)散布中失去一个临界卡方值。如果卡方测验统计量的察看值超过临界值,则回绝模型合乎数据的无效假设。否则,H0被保留。发现察看统计量超过临界值(意味着上尾概率低于指定的程度),就会导致统计学上的判断,即假如和理论人口协方差矩阵之间的差别太大,不能仅仅归因于抽样误差。因而,具备统计学意义的卡方测验统计数字提供了拥护假如模型有效性的证据。
当应用这个框架测试统计假设时,会呈现两种类型的谬误。不正确地回绝一个真正的H0(一个正确的模型)的谬误(或I型谬误)和不正确地保留一个谬误的H0(一个谬误的模型)的谬误(或II型谬误)。
如果H0为假,则卡方测验统计量不再是核心 2(df)散布,而是能够证实遵循非核心 2(df,)散布,具备非核心性参数和期望值df + (MacCallum, Browne, & Sugawara, 1996)。非核心性参数将非核心 2(df,)散布的期望值移到相应核心散布的左边。在确定了与核心 2(df)散布的冀望概率相干的临界值之后,能够通过构建具备肯定非核心性参数的相应非核心 2(df,)散布并取得该散布向右的面积(即。相应地,统计效力是非核心 2(df,)散布在临界值左边的面积(即积分)。个别状况如图1所示。
图1形容了核心(实线) 2(df)和非核心(虚线) 2(df,)散布,df=200,=100。核心散布 2(df)在临界值右侧的面积反映了误差。实线示意临界值为234,对应于=0.05。虚线示意从折衷效力剖析中失去的临界值为244,与=0.018无关。临界值右边的 2(df,)散布区域是-谬误概率(临界值234和244的=0.006和=0.018)。统计效力定义为1-,即临界值左边的非核心 2(df,)散布下的面积。
衡量标准
为了定义H0和H1模型之间的差别,能够应用任何基于非核心性的成果测量。
F0
F0是最大似然拟合函数的总体最小值,定义为
其中是p总体协方差矩阵,是p模型隐含的协方差矩阵,p是观测变量的数量。如果模型是正确的,=,F0=0。否则,F0>0,数值越大,示意模型与数据的差别越大(不匹配)。
RMSEA
近似根均方误差(RMSEA;Browne & Cudeck, 1992;Steiger & Lind, 1980)通过模型的自由度来掂量F0。
使RMSEA以零为界,较低的值示意较好的拟合。隐含的F0是:
用RMSEA来定义一个效应须要阐明自由度。
Mc
Mc(McDonald,1989)是F0在0-1区间上的变换,数值越大示意越适宜。
GFI
拟合指数(GFI;Jöreskog & Sörbom, 1984;Steiger, 1990)在0-1的区间内对F0进行标度,数值越高示意拟合度越好。
因为GFI取决于察看变量的数量(p),在用GFI定义效力时须要提供这个数字。
AGFI
调整后的拟合指数(AGFI;Jöreskog & Sörbom,1984;Steiger,1990)对GFI进行了批改,包含对自在参数数量的惩办,由模型的自由度来掂量。
用AGFI来阐明成果,须要同时阐明察看变量的数量(p)和模型的自由度(df)。
不基于非核心性的办法
不基于非核心性的拟合指数与F0没有间接的关系,因而不太适宜于效力剖析。然而,如果通过H0和H1协方差矩阵来定义效应,至多能够计算出度量。
SRMR
标准化根-均方残差(SRMR)是对(标准化)模型和总体协方差矩阵之间均匀(平方)差值的掂量,因而它的范畴是0到1,数值越小示意拟合度越高。设E0为模型隐含与人群协方差矩阵之间的差值,E0=-,vech示意矢量化变换,Q为维度为.5p(p+1)的对角矩阵,蕴含观测变量i和j的标准差的乘积的逆值,那么,SRMR能够定义为
残差矩阵E0与F0的关系很简单,取决于模型隐含的协方差矩阵,所以SRMR不太适宜用F0来定义效应(基于ML预计)。
CFI
比拟拟合指数(CFI)是一个增量指数,示意假如模型(F0H)绝对于空模型(F0N)的不适合比例缩小,空模型被定义为一个将所有协方差束缚为零的模型。在总体中,CFI的范畴是0到1,数值越高示意越适宜。
尽管从CFI取得F0很简略,但这须要晓得F0N,而这是很难先验确定的。
Power Analysis效力剖析
进行效力剖析时,个别须要阐明要检测的效应的量度和大小,并提供模型的自由度。依据效力剖析的类型,还须要进一步的论据。本节假如效应是以上述办法之一来指定的,如何借助模型隐含的和总体协方差矩阵来定义效应。
A-Priori:确定所需的N,给定、、效应和df
先验效力剖析的目标是在给定的误差下,确定检测一个效应所需的样本量。在构造方程模型的语言中,先验能力剖析问的是:"我须要多少个观测值能力达到成果?如果我的模型实际上是谬误的(在所选效应定义的范畴内),我须要多少个观测值能力以X%的概率(力量)来证伪我的模型?
进行先验的效力剖析须要指定误差、所需的效力(或者,等同于可承受的误差)、效应的类型和大小以及模型df。依据所抉择的效应大小指标,可能还须要定义察看变量的数量。
假如,咱们想要检测一个模型(波及df=100个自由度)的谬误阐明所需的样本量,在误差为0.05的状况下,效力为80%,其中失拟量对应于RMSEA=0.05。将后果存储在一个名为ap1的列表中。
effect = .05, effect.measure = 'RMSEA',alpha = .05, power = .80, df = 100
在ap1上调用总结办法,输入后果和相干的核心和非核心卡方分布图
这表明N=164产生了大概80%的效力来检测指定的成果。输入后果进一步显示了临界Chi-Square,非核心性参数(NCP),以及谬误概率之间的比率(隐含Alpha/Beta比率)。在这个例子中,阿尔法和贝塔之间的比率是0.25,表明犯Beta谬误的可能性是犯Alpha谬误的四倍。这显然是所选输出参数的后果,因为0.80的效力(1-)意味着0.20的误差,是所选0.05的误差的四倍。
effect = .05, effect.measure = 'RMSEA',alpha = .05, power = .80
当初咱们也失去了RMSEA=0.05的GFI和AGFI等效值,假如df=100,p=20。当然也能够不指定所需的效力,而是指定可承受的误差。例如,调用
effect.measure = 'RMSEA',alpha = .05, beta = .20, df = 100, p = 20
给出了与上述雷同的输入。如果你对肯定范畴内的样本量的效力变动感兴趣,要求提供效力图是很有用的,上面会具体阐明。
预先剖析Post-hoc:给定、N、效应和df,确定达到的效力
预先效力剖析的目标是确定在给定的样本量下,在肯定的误差下检测特定效应的理论达到的效力。用构造方程模型的语言来说,预先效力剖析问的是:"在我手头的样本中,有多大?在我手头的样本中,如果我的模型的确是谬误的(至多在所选效应定义的范畴内),那么伪造我的模型的概率(力量)有多大?进行预先效力剖析须要明确阿尔法误差、样本量、效应的类型和大小以及模型df。同样,依据所抉择的效应大小指标,可能还须要定义察看变量的数量。假如,咱们心愿在样本量为N=1000的状况下达到的效力可能检测到模型(波及df=100自由度)的谬误,误差为0.05,其中谬误拟合量对应于RMSEA=0.05。咱们将后果存储在一个名为ph1的列表中。
posthoc(effect = .05, effect.measure = 'RMSEA',alpha = .05, N = 1000
在ph1上调用总结办法,显示效力十分高(效力>.9999)。相干的误差概率是以更高的精度提供的。具体来说,误差为=2.903302e-17,转化为2.9-10-17=0.000000000000000029。在实践中,在这些条件下,一个RMSEA>=.05(或F0>=0.25或Mc<=.882)的模型很不错。隐含的/比率是1.722177e+15,表明犯谬误的可能性是犯谬误的2万亿(1015)倍。如果你对一系列不同水平的成果(例如,对于RMSEA从0.01到0.15)的效力变动感兴趣,要求提供效力图是很有用的,上面会具体阐明。
折衷效力剖析:给定/比率、N、效应和df,确定和
折衷效力剖析的目标是在给定的效应、肯定的样本量以及冀望的和比率的状况下,确定和(以及相干的卡方测验统计量的临界值)(Moshagen & Erdfelder, 2016)。用构造方程模型的语言来说,折衷剖析问的是:"在我手头的样本中,应该如何解决?在我手头的样本中,我应该如何抉择卡方模型测验的临界值,来决定我的模型是与齐全拟合的假如相一致时取得相应的和误差?
假如,咱们想确定临界卡方和相干的和误差,使它们相等(即比率为1)。咱们的模型波及100个df,咱们的样本量为N=1000,咱们将不可承受的不适合H1模型定义为RMSEA至多为0.08的模型。将后果存储在一个名为cp1的列表中。
compromise(effect = .08, effect.measure = 'RMSEA', N = 1000, df = 100)
结果显示,抉择临界Chi-Square=312与均衡谬误概率无关,=1.2e-23和=1.2e-23。依照要求,这两个谬误概率都一样大。如果出于某种原因,你心愿谬误概率不同(例如,因为你认为谬误地承受一个不正确的模型比谬误地回绝一个正确的模型要差100倍),你能够扭转abratio参数。例如,要求误差是误差的100倍,能够通过设置 abratio = 100 来实现。
compromise(effect = .08, effect.measure = 'RMSEA',abratio = 100, N = 1000, df = 100)
Power Plots效力图
效力图显示了隐含的效力与其余一些变量的关系。你能够绘制在不同样本量范畴内检测某一效应的实现效力。或者,你能够在给定的N下绘制达到的效力,以检测不同效应大小的范畴。
确定给定效应的效力是N的函数
创立了一个图,显示了在肯定的样本量范畴内检测一个给定的效应的达到的效力。然而,因为很难指定给定效应的诊断样本量,咱们须要提供所需的效力范畴。例如,假如咱们对检测RMSEA=.05的效应的效力如何随N的变动而变动感兴趣,咱们对从.05到.99的效力感兴趣(留神效力不能小于)。能够通过设置参数power.min = .05和power.max = .99来实现。此外,与任何先验的效力剖析一样,须要定义效应的类型和大小、df和误差。
powerPlot
这表明,当N>250时,一个相干的RMSEA=0.05的模型被回绝的效力十分大,而当N<100时,效力就很小。
在给定的N下,确定效力与效应大小的函数关系
创立了一个图,显示在给定的样本量下,在效应大小范畴内达到的效力。例如,假如咱们对N=500时的效力如何随效应大小的变动而变动感兴趣,对应的RMSEA范畴是0.001到0.10。此外,与任何预先效力剖析一样,须要定义样本量、df和误差。
PlotEffect
这表明,在N=500的状况下,一个相干的RMSEA>0.04的模型被检测到的效力十分大,而RMSEA<0.03的效力则相当小。
参考文献
• Browne, M. W., & Cudeck, R. (1992). Alternative ways of assessing model fit. Sociological Methods & Research, 21, 230–258.
• Jöreskog, K. G., & Sörbom, D. (1984). LISREL VI user’s guide (3rd ed.). Mooresville: Scientific Software.
最受欢迎的见解
1.Matlab马尔可夫链蒙特卡罗法(MCMC)预计随机稳定率(SV,Stochastic Volatility) 模型
2.基于R语言的疾病制图中自适应核密度估计的阈值抉择办法
3.WinBUGS对多元随机稳定率模型:贝叶斯预计与模型比拟
4.R语言回归中的hosmer-lemeshow拟合优度测验
5.matlab实现MCMC的马尔可夫切换ARMA – GARCH模型预计
6.R语言区间数据回归剖析
7.R语言WALD测验 VS 似然比测验
8.python用线性回归预测股票价格
9.R语言如何在生存剖析与Cox回归中计算IDI,NRI指标