关于算法:拓端tecdatR语言结构方程SEM中的power-analysis-效能检验分析

3次阅读

共计 5606 个字符,预计需要花费 15 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=23085 

简介

本文对构造方程模型进行效力剖析。

本文从一些简略的例子开始。其余部分提供了一些对于统计背景的阐明,各种效应大小的定义,以及本包所含函数的详细描述。

背景介绍

数学模型的统计评估通常是通过思考测试统计量来进行的,测试统计量示意察看数据和拟合模型的数据之间的差别。在 SEM 中,大小为 N 的样本的相干测试统计量由 T = Fˆ(N – 1) 给出。Fˆ示意所选差别函数(如最大似然)的最小化样本值,从而表明模型与样本数据的不匹配。因而,T 容许对模型正确的无效假设(H0)进行似然比测验。如果假如的模型在总体中成立,能够证实 T 在渐进上遵循核心 χ 2(df)散布,df=.5-p(p+1)- q 自由度,其中 p 是体现变量的数量,q 示意自在参数的数量。这就是为什么 T 常常被称为 “ 卡方模型测验统计量 ”。

给出一个卡方测验统计量的察看值,能够进行一个无效假设的显著性测验。通常的测验过程如下。给定一个特定的 α - 误差程度(通常是 α =0.05),从渐近核心 χ 2(df)散布中失去一个临界卡方值。如果卡方测验统计量的察看值超过临界值,则回绝模型合乎数据的无效假设。否则,H0 被保留。发现察看统计量超过临界值(意味着上尾概率低于指定的 α 程度),就会导致统计学上的判断,即假如和理论人口协方差矩阵之间的差别太大,不能仅仅归因于抽样误差。因而,具备统计学意义的卡方测验统计数字提供了拥护假如模型有效性的证据。

当应用这个框架测试统计假设时,会呈现两种类型的谬误。不正确地回绝一个真正的 H0(一个正确的模型)的 α 谬误(或 I 型谬误)和不正确地保留一个谬误的 H0(一个谬误的模型)的 β 谬误(或 II 型谬误)。

如果 H0 为假,则卡方测验统计量不再是核心 χ 2(df)散布,而是能够证实遵循非核心 χ 2(df,λ)散布,具备非核心性参数 λ 和期望值 df + λ(MacCallum, Browne, & Sugawara, 1996)。非核心性参数 λ 将非核心 χ 2(df,λ)散布的期望值移到相应核心散布的左边。在确定了与核心 χ 2(df)散布的冀望 α 概率相干的临界值之后,能够通过构建具备肯定非核心性参数 λ 的相应非核心 χ 2(df,λ)散布并取得该散布向右的面积(即。相应地,统计效力是非核心 χ 2(df,λ)散布在临界值左边的面积(即积分)。个别状况如图 1 所示。

图 1 形容了核心(实线)χ 2(df)和非核心(虚线)χ 2(df,λ)散布,df=200,λ=100。核心散布 χ 2(df)在临界值右侧的面积反映了 α 误差。实线示意临界值为 234,对应于 α =0.05。虚线示意从折衷效力剖析中失去的临界值为 244,与 α =0.018 无关。临界值右边的 χ 2(df,λ)散布区域是 β - 谬误概率(临界值 234 和 244 的 β =0.006 和 β =0.018)。统计效力定义为 1 -β,即临界值左边的非核心 χ 2(df,λ)散布下的面积。

衡量标准

为了定义 H0 和 H1 模型之间的差别,能够应用任何基于非核心性的成果测量。

F0

F0 是最大似然拟合函数的总体最小值,定义为

其中 Σ 是 p 总体协方差矩阵,Σˆ是 p 模型隐含的协方差矩阵,p 是观测变量的数量。如果模型是正确的,Σˆ=Σ,F0=0。否则,F0>0,数值越大,示意模型与数据的差别越大(不匹配)。

RMSEA

近似根均方误差(RMSEA;Browne & Cudeck, 1992;Steiger & Lind, 1980)通过模型的自由度来掂量 F0。

使 RMSEA 以零为界,较低的值示意较好的拟合。隐含的 F0 是:

用 RMSEA 来定义一个效应须要阐明自由度。

Mc

Mc(McDonald,1989)是 F0 在 0 - 1 区间上的变换,数值越大示意越适宜。

GFI

拟合指数(GFI;Jöreskog & Sörbom, 1984;Steiger, 1990)在 0 - 1 的区间内对 F0 进行标度,数值越高示意拟合度越好。

因为 GFI 取决于察看变量的数量(p),在用 GFI 定义效力时须要提供这个数字。

AGFI

调整后的拟合指数(AGFI;Jöreskog & Sörbom,1984;Steiger,1990)对 GFI 进行了批改,包含对自在参数数量的惩办,由模型的自由度来掂量。

用 AGFI 来阐明成果,须要同时阐明察看变量的数量(p)和模型的自由度(df)。

不基于非核心性的办法

不基于非核心性的拟合指数与 F0 没有间接的关系,因而不太适宜于效力剖析。然而,如果通过 H0 和 H1 协方差矩阵来定义效应,至多能够计算出度量。

SRMR

标准化根 - 均方残差(SRMR)是对(标准化)模型和总体协方差矩阵之间均匀(平方)差值的掂量,因而它的范畴是 0 到 1,数值越小示意拟合度越高。设 E0 为模型隐含与人群协方差矩阵之间的差值,E0=Σ-Σˆ,vech 示意矢量化变换,Q 为维度为.5p(p+1) 的对角矩阵,蕴含观测变量 i 和 j 的标准差的乘积的逆值,那么,SRMR 能够定义为

残差矩阵 E0 与 F0 的关系很简单,取决于模型隐含的协方差矩阵,所以 SRMR 不太适宜用 F0 来定义效应(基于 ML 预计)。

CFI

比拟拟合指数(CFI)是一个增量指数,示意假如模型(F0H)绝对于空模型(F0N)的不适合比例缩小,空模型被定义为一个将所有协方差束缚为零的模型。在总体中,CFI 的范畴是 0 到 1,数值越高示意越适宜。

尽管从 CFI 取得 F0 很简略,但这须要晓得 F0N,而这是很难先验确定的。

Power Analysis 效力剖析

进行效力剖析时,个别须要阐明要检测的效应的量度和大小,并提供模型的自由度。依据效力剖析的类型,还须要进一步的论据。本节假如效应是以上述办法之一来指定的,如何借助模型隐含的和总体协方差矩阵来定义效应。

A-Priori:确定所需的 N,给定 α、β、效应和 df

先验效力剖析的目标是在给定的 α 误差下,确定检测一个效应所需的样本量。在构造方程模型的语言中,先验能力剖析问的是:” 我须要多少个观测值能力达到成果?如果我的模型实际上是谬误的(在所选效应定义的范畴内),我须要多少个观测值能力以 X% 的概率(力量)来证伪我的模型?

进行先验的效力剖析须要指定 α 误差、所需的效力(或者,等同于可承受的 β 误差)、效应的类型和大小以及模型 df。依据所抉择的效应大小指标,可能还须要定义察看变量的数量。

假如,咱们想要检测一个模型(波及 df=100 个自由度)的谬误阐明所需的样本量,在 α 误差为 0.05 的状况下,效力为 80%,其中失拟量对应于 RMSEA=0.05。将后果存储在一个名为 ap1 的列表中。

effect = .05, effect.measure = 'RMSEA',
alpha = .05, power = .80, df = 100

在 ap1 上调用总结办法,输入后果和相干的核心和非核心卡方分布图 

这表明 N =164 产生了大概 80% 的效力来检测指定的成果。输入后果进一步显示了临界 Chi-Square,非核心性参数(NCP),以及谬误概率之间的比率(隐含 Alpha/Beta 比率)。在这个例子中,阿尔法和贝塔之间的比率是 0.25,表明犯 Beta 谬误的可能性是犯 Alpha 谬误的四倍。这显然是所选输出参数的后果,因为 0.80 的效力(1-β)意味着 0.20 的 β 误差,是所选 0.05 的 α 误差的四倍。

effect = .05, effect.measure = 'RMSEA',
alpha = .05, power = .80

当初咱们也失去了 RMSEA=0.05 的 GFI 和 AGFI 等效值,假如 df=100,p=20。当然也能够不指定所需的效力,而是指定可承受的 β 误差。例如,调用 

effect.measure = 'RMSEA',
alpha = .05, beta = .20, df = 100, p = 20

 

给出了与上述雷同的输入。如果你对肯定范畴内的样本量的效力变动感兴趣,要求提供效力图是很有用的,上面会具体阐明。
 

预先剖析 Post-hoc:给定 α、N、效应和 df,确定达到的效力

预先效力剖析的目标是确定在给定的样本量下,在肯定的 α 误差下检测特定效应的理论达到的效力。用构造方程模型的语言来说,预先效力剖析问的是:” 在我手头的样本中,有多大?在我手头的样本中,如果我的模型的确是谬误的(至多在所选效应定义的范畴内),那么伪造我的模型的概率(力量)有多大?进行预先效力剖析须要明确阿尔法误差、样本量、效应的类型和大小以及模型 df。同样,依据所抉择的效应大小指标,可能还须要定义察看变量的数量。假如,咱们心愿在样本量为 N =1000 的状况下达到的效力可能检测到模型(波及 df=100 自由度)的谬误,α 误差为 0.05,其中谬误拟合量对应于 RMSEA=0.05。咱们将后果存储在一个名为 ph1 的列表中。

posthoc(effect = .05, effect.measure = 'RMSEA',
alpha = .05, N = 1000

在 ph1 上调用总结办法,显示效力十分高(效力 >.9999)。相干的误差概率是以更高的精度提供的。具体来说,β 误差为 β =2.903302e-17,转化为 2.9-10-17=0.000000000000000029。在实践中,在这些条件下,一个 RMSEA>=.05(或 F0>=0.25 或 Mc<=.882)的模型很不错。隐含的 α / β 比率是 1.722177e+15,表明犯 α 谬误的可能性是犯 β 谬误的 2 万亿(1015)倍。如果你对一系列不同水平的成果(例如,对于 RMSEA 从 0.01 到 0.15)的效力变动感兴趣,要求提供效力图是很有用的,上面会具体阐明。

折衷效力剖析:给定 α / β 比率、N、效应和 df,确定 α 和 β

折衷效力剖析的目标是在给定的效应、肯定的样本量以及冀望的 α 和 β 比率的状况下,确定 α 和 β(以及相干的卡方测验统计量的临界值)(Moshagen & Erdfelder, 2016)。用构造方程模型的语言来说,折衷剖析问的是:” 在我手头的样本中,应该如何解决?在我手头的样本中,我应该如何抉择卡方模型测验的临界值,来决定我的模型是与齐全拟合的假如相一致时取得相应的 α 和 β 误差?

假如,咱们想确定临界卡方和相干的 α 和 β 误差,使它们相等(即比率为 1)。咱们的模型波及 100 个 df,咱们的样本量为 N =1000,咱们将不可承受的不适合 H1 模型定义为 RMSEA 至多为 0.08 的模型。将后果存储在一个名为 cp1 的列表中。

compromise(effect = .08, effect.measure = 'RMSEA',
 N = 1000, df = 100)

结果显示,抉择临界 Chi-Square=312 与均衡谬误概率无关,α=1.2e-23 和 β =1.2e-23。依照要求,这两个谬误概率都一样大。如果出于某种原因,你心愿谬误概率不同(例如,因为你认为谬误地承受一个不正确的模型比谬误地回绝一个正确的模型要差 100 倍),你能够扭转 abratio 参数。例如,要求 α 误差是 β 误差的 100 倍,能够通过设置 abratio = 100 来实现。

compromise(effect = .08, effect.measure = 'RMSEA',
abratio = 100, N = 1000, df = 100)

Power Plots 效力图

效力图显示了隐含的效力与其余一些变量的关系。你能够绘制在不同样本量范畴内检测某一效应的实现效力。或者,你能够在给定的 N 下绘制达到的效力,以检测不同效应大小的范畴。

确定给定效应的效力是 N 的函数

创立了一个图,显示了在肯定的样本量范畴内检测一个给定的效应的达到的效力。然而,因为很难指定给定效应的诊断样本量,咱们须要提供所需的效力范畴。例如,假如咱们对检测 RMSEA=.05 的效应的效力如何随 N 的变动而变动感兴趣,咱们对从.05 到.99 的效力感兴趣(留神效力不能小于 α)。能够通过设置参数 power.min = .05 和 power.max = .99 来实现。此外,与任何先验的效力剖析一样,须要定义效应的类型和大小、df 和 α 误差。

powerPlot

这表明,当 N >250 时,一个相干的 RMSEA=0.05 的模型被回绝的效力十分大,而当 N <100 时,效力就很小。

在给定的 N 下,确定效力与效应大小的函数关系

创立了一个图,显示在给定的样本量下,在效应大小范畴内达到的效力。例如,假如咱们对 N =500 时的效力如何随效应大小的变动而变动感兴趣,对应的 RMSEA 范畴是 0.001 到 0.10。此外,与任何预先效力剖析一样,须要定义样本量、df 和 α 误差。

PlotEffect

这表明,在 N =500 的状况下,一个相干的 RMSEA>0.04 的模型被检测到的效力十分大,而 RMSEA<0.03 的效力则相当小。

参考文献

• Browne, M. W., & Cudeck, R. (1992). Alternative ways of assessing model fit. Sociological Methods & Research, 21, 230–258.

• Jöreskog, K. G., & Sörbom, D. (1984). LISREL VI user’s guide (3rd ed.). Mooresville: Scientific Software.


最受欢迎的见解

1.Matlab 马尔可夫链蒙特卡罗法(MCMC)预计随机稳定率(SV,Stochastic Volatility)模型

2. 基于 R 语言的疾病制图中自适应核密度估计的阈值抉择办法

3.WinBUGS 对多元随机稳定率模型:贝叶斯预计与模型比拟

4. R 语言回归中的 hosmer-lemeshow 拟合优度测验

5.matlab 实现 MCMC 的马尔可夫切换 ARMA – GARCH 模型预计

6. R 语言区间数据回归剖析

7. R 语言 WALD 测验 VS 似然比测验

8.python 用线性回归预测股票价格

9. R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

正文完
 0