多重比拟的问题

当同一钻研问题下进行屡次假设检验时，不再合乎小概率原理所说的“一次试验”。如果在该钻研问题下只有有测验是阳性的，就对该问题下阳性论断的话，对该问题的测验的犯一类谬误的概率就会增大。如果同一问题下进行n次测验，每次的测验水准为（每次假阳性概率为），则n次测验至多呈现一次假阳性的概率会比大。假如每次测验独立的条件下该概率可减少至

常见的多重比拟情景包含：

多组间比拟
多个次要指标
临床试验中期中剖析
亚组剖析

管制多重比拟舛误（Familywise error rate)：Bonferroni改正

Bonferroni法失去的改正P值=P×n
Bonferroni法非常简单，它的毛病在于十分激进（大略是各种办法中最激进的了），尤其当n很大时，通过Bonferroni法改正后总的一类谬误可能会远远小于既定。

管制谬误发现率：Benjamini & Hochberg法

简称BH法。首先将各P值从小到大排序，生成程序数
排第k的改正P值=P×n/k
另外要保障改正后的各测验的P值大小程序不发生变化。

怎么做测验

R内置了一些办法来调整一系列p值，以管制多重比拟舛误（Familywise error rate)或管制谬误发现率。

Holm、Hochberg、Hommel和Bonferroni办法管制了多重比拟舛误（Familywise error rate)。这些办法试图限度谬误发现的概率（I型谬误，在没有实际效果时谬误地回绝无效假设），因而都是绝对较激进的。

办法BH（Benjamini-Hochberg，与R中的FDR雷同）和BY（Benjamini & Yekutieli）管制谬误发现率，这些办法试图管制谬误发现的冀望比例。

请留神，这些办法只须要调整p值和要比拟的p值的数量。这与Tukey或Dunnett等办法不同，Tukey和Dunnett也须要根底数据的变异性。Tukey和Dunnett被认为是多重比拟舛误（Familywise error rate)办法。

要理解这些不同调整的激进水平，请参阅本文上面的两个图。

对于应用哪种p值调整度量没有明确的倡议。一般来说，你应该抉择一种你的钻研畛域相熟的办法。此外，可能有一些逻辑容许你抉择如何均衡犯I型谬误和犯II型谬误的概率。例如，在一项初步钻研中，你可能心愿保留尽可能多的显著值，来防止在将来的钻研中排除潜在的显著因素。另一方面，在危及生命并且医治费用低廉的医学钻研中，得出一种医治办法优于另一种医治办法的论断之前，你应该有很高的把握。

具备25个p值的多重比拟示例

### --------------------------------------------------------------### 多重比拟示例### --------------------------------------------------------------Data = read.table(Input,header=TRUE)

按p值排序数据

Data = Data\[order(Data$Raw.p),\]

检查数据是否按预期的形式排序

执行p值调整并增加到数据框

Data$Bonferroni =      p.adjust(Data$Raw.p,               method = "bonferroni")Data$BH =      p.adjust(Data$Raw.p,               method = "BH")Data$Holm =      p.adjust(Data$ Raw.p,               method = "holm")Data$Hochberg =      p.adjust(Data$ Raw.p,               method = "hochberg")Data$Hommel =      p.adjust(Data$ Raw.p,               method = "hommel")Data$BY =      p.adjust(Data$ Raw.p,               method = "BY")Data

绘制图表

plot(X, Y,        xlab="原始的p值",        ylab="改正后的P值"        lty=1,        lwd=2

调整后的p值与原始的p值的图为一系列的25个p值。虚线示意一对一的线。

5个p值的多重比拟示例

### --------------------------------------------------------------### 多重比拟示例，假如示例### --------------------------------------------------------------Data = read.table(Input,header=TRUE)

执行p值调整并增加到数据帧

Data$Bonferroni =      p.adjust(Data$Raw.p,               method = "bonferroni")Data$BH =      signif(p.adjust(Data$Raw.p,               method = "BH"),             4)Data$Holm =      p.adjust(Data$ Raw.p,               method = "holm")Data$Hochberg =      p.adjust(Data$ Raw.p,               method = "hochberg")Data$Hommel =      p.adjust(Data$ Raw.p,               method = "hommel")Data$BY =      signif(p.adjust(Data$ Raw.p,               method = "BY"),             4)Data

绘制(图表)

plot(X, Y,        type="l",

调整后的p值与原始p值在0到0.1之间的一系列5个p值的绘图。请留神，Holm和Hochberg的值与Hommel雷同，因而被Hommel暗藏。虚线示意一对一的线。

最受欢迎的见解

1.Matlab马尔可夫链蒙特卡罗法（MCMC）预计随机稳定率（SV，Stochastic Volatility）模型

2.基于R语言的疾病制图中自适应核密度估计的阈值抉择办法

3.WinBUGS对多元随机稳定率模型：贝叶斯预计与模型比拟

4.R语言回归中的hosmer-lemeshow拟合优度测验

5.matlab实现MCMC的马尔可夫切换ARMA – GARCH模型预计

6.R语言区间数据回归剖析

7.R语言WALD测验 VS 似然比测验

8.python用线性回归预测股票价格

9.R语言如何在生存剖析与Cox回归中计算IDI，NRI指标