原文链接:http://tecdat.cn/?p=3715
统计测验最常见的畛域之一是测验列联表中的独立性。在这篇文章中,我将展现如何计算列联表,我将在列联表中引入两个风行的测验:卡方测验 和Fisher 准确测验。
什么是列联表?
列联表提供对于两个分类变量的测量的整数计数。最简略的列联表是一个2 × 2 频率表,由两个变量产生,每个变量有两个级别:
组 / 察看
察看 1
察看 2
第 1 组
ñ1,1
ñ1,2
第 2 组
ñ2,1
ñ2,2
给定这样一个表格,问题是_第 1 组_是否体现出与_第 2 组_相比的观测频率。这些组代表因变量,因为它们依赖于自变量的察看。请留神,列联表必须是一种常见的误会 2 × 2; 它们能够具备任意数量的维度,具体取决于变量显示的级别数。尽管如此,应防止对具备多个维度的列联表进行统计测验,因为除其余起因外,解释后果将具备挑战性。
数据集
要钻研列联表的测验,咱们将应用_warpbreaks_数据集:
data(warpbreaks)
head(warpbreaks)
## breaks wool tension
## 1 26 A L
## 2 30 A L
## 3 54 A L
## 4 25 A L
## 5 70 A L
## 6 52 A L
这是一个蕴含来自纺织行业的三个变量的数据集:_断_形容了羊毛 拉断 的次数 形容了通过测验的羊毛类型 张力∈ {L,M,H}给出了施加在螺纹上的张力(低,中或高)。数据集中的每一行示意单个织机的测量值。为了解释不同织机的可变性,对_羊毛_和_张力的_每种组合进行了 9 次测量,数据集总共蕴含 9 ⋅ 2 ⋅ 3 = 549⋅2⋅3=54 察看后果。
剖析指标
咱们想确定一种类型的羊毛在不同水平的 拉紧 状况下是否优于另一种羊毛。为了钻研咱们是否能够找到一些差别的证据,让咱们来看看数据:
为了钻研 断裂 数的差别,让咱们可视化数据:
从图中咱们能够看出,总体而言,羊毛 B 与较少的断裂相关联。羊毛 A 仿佛特地低劣,因为低张力。
转换为列联表
为了取得列联表,咱们首先须要总结两种类型的羊毛和三种类型的张力的不同织机的断裂。
## wool tension breaks
## 1 A L 401
## 2 A M 216
## 3 A H 221
## 4 B L 254
## 5 B M 259
## 6 B H 169
而后咱们应用xtabs
_穿插表_函数来生成列联表:
## tension
## wool L M H
## A 401 216 221
## B 254 259 169
当初,df
咱们有了利用统计检验所需的构造。
统计测验
用于确定来自不同组的测量值是否独立的两种最常见的测验是卡方测验(χ2 测验)和费舍尔的准确测验。请留神,如果测量后果配对,则应应用 McNemar 测验(例如,能够辨认单个织机)。
皮尔逊的卡方测验
该 χ2test 是一种非参数检验,可利用于具备各种维度的列联表。测验名称源自 χ2 散布,即独立规范正态变量的平方散布。这是测验统计的散布 χ2 测验
## \[1\] 7.900708e-07
因为 p 值小于 0.05,咱们能够在 5%显着性程度上回绝测验的零假如(断裂的频率独立于羊毛)。依据df
,能够宣称羊毛 B 比羊毛 A 显著更好(绝对于断裂)。
Pearson 残差
另一种办法是思考测验的卡方值。该 chisq.test
函数提供卡方值的 Pearson 残差(根)。与由平方差别产生的卡方值相同,残差不是平方的。因而,残差反映了观测值超过预期值(正值)或低于预期值(负值)的水平。在咱们的数据集中,正值示意比预期更多的断裂,而负值示意更少的断点:
## tension
## wool L M H
## A 2.0990516 -2.8348433 0.4082867
## B -2.3267672 3.1423813 -0.4525797
残差 表明,与羊毛 A 相比,羊毛 B 的低张力和高张力断裂比预期的要少。然而,对于中等张力,羊毛 B 比预期的断裂更多。再次,咱们发现,整体羊毛 B 优于羊毛 A.残差 的值也表明羊毛 B 对于低张力(残差为 2.1),高张力(0.41)和中等张力重大(– 2.8)。然而,残差 有助于咱们辨认羊毛 B 的问题:它对中等张力的体现不佳。这将如何促成进一步倒退?为了取得在所有张力程度下体现良好的羊毛,咱们须要专一于改善羊毛 B 的中等张力。为此,咱们能够思考使羊毛 A 在中等张力下体现更好的个性。
费舍尔 Fisher 准确 测验
Fisher 的准确测验是用于测验独立性的非参数检验,通常仅用于测验 2 × 2 列联表。作为准确显着性测验,Fisher 测验合乎所有假如,在此基础上定义测验统计量的散布。实际上,这意味着谬误回绝率等于测验的显着性程度,对于近似测验,例如 χ2 测验。简而言之,Fisher 的准确测验依赖于应用二项式系数依据超几何散布计算 p 值。
因为计算的因子可能变得十分大,Fisher 准确测验可能不适用于大样本量。
请留神,无奈指定测验的代替办法,df
因为劣势比(示意成果大小)仅定义为 2 × 2 矩阵。
咱们依然能够执行 Fisher 准确测验以取得 p 值:
## \[1\] 8.162421e-07
失去的 p 值相似于从中取得的 p 值 χ2 测验并得出雷同的论断:咱们能够回绝零假如,即羊毛的类型与不同应力程度下察看到的断裂次数无关。
转换为 2 乘 2 矩阵
为了指定备选假如并取得劣势比,咱们能够计算三者的测验 2 × 2 能够结构的矩阵df
:
因为代替计划设置得_更大_,这意味着咱们正在进行单尾检验,其中另一种假如是羊毛 A 与羊毛 B 的断裂次数相干(即咱们预期 O R > 1)。通过执行测验 2 × 2 表格,咱们也取得了解释性:咱们当初能够辨别羊毛不同的具体条件。然而,在解释 p 值之前,咱们须要纠正多个假设检验。在这种状况下,咱们进行了三次测验。在这里,咱们只需将 0.05 的初始显着性程度调整为 0.053,依据 Bonferroni 办法。依据调整后的阈值,以下测验显着:
## \[1\] "L vs others"
这一发现表明,如果力较轻,羊毛 B 仅显着优于羊毛 A. 请留神,咱们也能够采纳构建办法 2 × 22 矩阵 χ2 测验。随着 χ2 然而,测验并不是必要的,因为咱们的剖析基于残差。
摘要:卡方对费舍尔的准确测验
以下是两个测验的属性摘要:
规范
卡方测验
费舍尔的准确测验
最小样本量
大
小
准确性
近似
准确
列联表
任意维度
通常为 2 ×2
解释
皮尔逊残差
劣势比
通常,Fisher 准确测验优于卡方测验,因为它是一种准确测验。如果单个察看后果很少(例如小于 10),则应特地防止卡方测验。因为 Fisher 的准确测验对于大样本量和精确度可能在计算上是不可行的,χ2 测验随着样本数量的减少而减少 χ2 在这种状况下,测验是适合的代替。另一个长处了 χ2 测验是它更适宜维数超过的列联表 2 × 2。