关于算法:R语言配对检验分析案例

41次阅读

共计 1725 个字符,预计需要花费 5 分钟才能阅读完成。

原文 http://tecdat.cn/?p=3424


什么是测验对?

测验对的模式 (x1,x2) 呈现在两种状况中:

  1. 对同一实体执行两次测量。例如,一项评估新型胰岛素疗效的临床钻研将为每位患者测量两次血糖程度:之前(X1)服药后(X2)
  2. 对不同的实体进行测量。然而,实体依据其特色进行匹配。例如,为了测试药物的效用,您可能心愿依据体重,年龄或其余特色配对钻研参与者,以管制这些混淆因素。

在第一种状况下,配对是数据生成过程的天然后果。在第二种状况下,配对由钻研设计强制执行。

为什么依赖测量有用?

应用配对 测验 ,能够管制影响测量后果的混淆因素。因而, 配对 钻研设计通常比波及独立组的设计更弱小。

睡眠数据集

让咱们思考睡眠数据集,举例说明:

data(sleep)
print(sleep)
##    extra group ID
## 1    0.7     1  1
## 2   -1.6     1  2
## 3   -0.2     1  3
## 4   -1.2     1  4
## 5   -0.1     1  5
## 6    3.4     1  6
## 7    3.7     1  7
## 8    0.8     1  8
## 9    0.0     1  9
## 10   2.0     1 10
## 11   1.9     2  1
## 12   0.8     2  2
## 13   1.1     2  3
## 14   0.1     2  4
## 15  -0.1     2  5
## 16   4.4     2  6
## 17   5.5     2  7
## 18   1.6     2  8
## 19   4.6     2  9
## 20   3.4     2 10

_extra_示意与基线测量相比睡眠中的减少 / 缩小(正 / 负值),_组_示意药物,_ID_示意患者 ID。为了更分明,我将_组_重命名为_药物_:

考察睡眠数据集

重要的是要留神每个人都是不同的。因而,雷同药物的效用可能因人而异。让咱们看看这个数据集中是否也是这种状况:

实际上,个体钻研对象的额定睡眠工夫散布仿佛是双峰的。大概一半的受试者体现出两种药物的睡眠持续时间大幅减少,而另一半受试者简直没有好处甚至患有药物。应用配对 测验,能够校对这些患者间差别,而对于假如测量是独立的测试,这是不可能的。

比拟不成对和配对测验

当初让咱们比拟不成对测试和配对 测验 对睡眠数据集的执行状况。

Wilcoxon 秩和测验

如果咱们在测量中应用未配对的 Wilcoxon 秩和测验(Mann-Whitney U 测验),则该测验将产生以下药物程序以确定显着性:

##  \[1\] 1 1 1 1 2 1 2 1 1 2 2 2 2 1 1 2 1 2 2 2
## Levels: 1 2

咱们能够看到,尽管代表性有余,但药物 1 在最高级别中呈现了好几次。这是因为,对于两种药物反馈良好的患者,药物 1 也运作良好。因为依赖药物的额定睡眠工夫没有显著的拆散,因而测试在 5%的程度上不会显着:

## \[1\] 0.06932758

_威尔科克森_符号秩测验

思考配对的测验值更有意义,因为测验后果不受个体受试者的药物敏感性的影响。咱们能够看到,当咱们计算患者内额定睡眠差别时,用于未配对 Wilcoxon 测验的度量:

##  \[1\] -1.2 -2.4 -1.3 -1.3  0.0 -1.0 -1.8 -0.8 -4.6 -1.4

非阳性差别分明地表明药物 1 在所有钻研受试者中都不如药物 2。因为 Wilcoxon 测验基于这些差别,因而发现两种药物在显着性程度为 5%时存在显着差别:

# 配对测验
w.unpaired <- wilcox.test(x, y, paired = TRUE)
print(w.unpaired$p.value)
  

``````
## \[1\] 0.009090698

论断

这个例子阐明了为什么分组钻研设计优于测验独立的钻研设计。当然,仅在应用思考配对测验的测试来评估数据的状况下才是这种状况。否则,实际上重要的后果可能被谬误地视为无关紧要。

十分感谢您浏览本文,有任何问题请在上面留言!

正文完
 0