乐趣区

关于程序员:数据分析通俗易懂假设检验

导读

大多数对于假设检验的教程都是从先验散布假如开始,列出一些定义和公式,而后间接利用它们来解决问题。然而,在本教程中,咱们将从第一准则中学习。这将是一个示例驱动的教程,咱们从一个根本示例开始,逐渐理解假设检验的内容。

1. 选哪个骰子?

设想一下,您背后有两个无奈辨别的骰子。您随机抉择一个骰子并扔掉它。在察看它落在哪张面上之后,您能确定您抉择了哪个骰子吗?

骰子的概率分布如下图所示:

Die 1:
P(X=x) = 1/6 if x = {1, 2, 3, 4, 5, 6}

Die 2:
P(X=x) = 1/4 if x = {1, 2}
       = 1/8 if x = {3, 4, 5, 6}

在二元假设检验问题中,咱们通常会面临两个咱们称之为假如的抉择,咱们必须决定是抉择一个还是另一个。

假如由 H₀ 和 H₁ 示意,别离称为原假如和备择假如。在假设检验中,咱们回绝或承受零假如。

在咱们的示例中,骰子 1 和骰子 2 别离是原假如和备择假如。承受或回绝零假如的决定取决于察看的散布。

所以咱们能够说假设检验的指标是画一个边界,把察看空间分成两个区域:回绝区域和承受区域。

如果落在回绝区域,咱们回绝原假如,否则咱们承受它。当初,决策边界不会是完满的,咱们会犯错误。例如,骰子 1 可能落在骰子 1 或 2 上,而咱们将其误认为是骰子 2;但产生这种状况的可能性较小。咱们将在下一节中学习如何计算错误概率。

咱们如何确定决策边界?有一种简略无效的办法称为似然比测验,咱们接下来将探讨。

2. 似然比测验

你必须首先意识到察看的散布取决于假如。上面我依据两个假如绘制了示例中的散布:

当初,P(X=x;H₀) 和 P(X=x;H₁) 别离示意在假如 H₀ 和 H₁ 下察看的可能性。它们的比率通知咱们,对于不同的察看,一个假如比另一个假如正确的可能性有多大。

这个比率称为似然比,用 L(X) 示意。L(X) 是依赖于察看值 x 的随机变量。

在似然比测验中,如果该比率高于某个值,咱们回绝原假如,即如果 L(X) > 𝜉 则回绝原假如,否则承受它。称为临界比。

因而,这就是咱们绘制决策边界的办法:咱们将似然比大于临界比的察看值与似然比大于临界值的察看值离开。

所以模式为 {x | L(x) > 𝜉 } 落入拒绝域,其余落入承受域。

让咱们用咱们的骰子例子来阐明它。似然比能够计算为:

L(X) = (1/4) / (1/6) = 3/2 if x = {1, 2}
     = (1/8) / (1/6) = 3/4 if x = {3, 4, 5, 6}

似然比图如下所示:

当初决策边界的搁置归结为抉择临界比率。假如临界比率是 3/2 和 3/4 之间的值,即 3/4 < 𝜉 < 3/2。而后咱们的决策边界看起来像这样:

if 3/4 < 𝜉 < 3/2:

L(X) > 𝜉 if x = {1, 2} (rejection region)
L(X) < 𝜉 if x = {3, 4, 5, 6} (acceptance region)

让咱们探讨与此决定相干的谬误。如果察看 x 属于回绝区域但产生在零假如下,则会产生第一类谬误。在咱们的示例中,这意味着骰子 1 落在 1 或 2 上。

这称为谬误回绝谬误或类型 1 谬误。此谬误的概率由下式示意并且能够计算为:

False Rejection Error:

𝛼 = P(X|L(X) > 𝜉 ; H₀)

如果察看 x 属于承受区域但产生在备择假如下,则会产生第二个谬误。这称为谬误承受谬误或类型 2 谬误。此谬误的概率由下式示意并且能够计算为:

False Acceptance Error:

𝛽 = P(X|L(X) < 𝜉 ; H₁)

在咱们的示例中,谬误回绝和谬误承受谬误能够计算为:

Computing errors in the dice example:

𝛼 = P(X|L(X) > 𝜉 ; H₀)
  = P(X={1, 2} ; H₀)
  = 2 * 1/6 
  = 1/3

𝛽 = P(X|L(X) < 𝜉 ; H₁)
  = P(X={3, 4, 5, 6} ; H₁)
  = 4 * 1/8
  = 1/2

让咱们思考另外两种状况,其中临界比率采纳以下值:𝜉 > 3/2 和 𝜉 < 3/4。

能够相似地计算类型 1 和类型 2 谬误。

𝛼 = 0 if 𝜉 > 3/2
  = 1/3 if 3/4 < 𝜉 < 3/2
  = 1 if 𝜉 < 3/4

𝛽 = 1 if 𝜉 > 3/2
  = 1/2 if 3/4 < 𝜉 < 3/2
  = 0 if 𝜉 < 3/4

让咱们绘制不同 𝜉 值的误差。

随着临界值的减少,拒绝域变小。后果,谬误回绝概率升高,而谬误承受概率减少。

3. 似然比的作用

咱们能够在察看空间的任何中央画出边界。为什么咱们须要计算似然比并通过所有这些?

上面我计算了不同边界的 I 类和 II 类谬误。

Type I and Type II errors for different boundaries.

'|' is the separator - {rejection region | acceptance region}

1. {|, 1, 2, 3, 4, 5, 6}
𝛼 = P(x={} ; H₀) = 0
𝛽 = P(x={1, 2, 3, 4, 5, 6} ; H₁) = 1
𝛼 + 𝛽 = 1

2. {1, |, 2, 3, 4, 5, 6}
𝛼 = P(x={1} ; H₀) = 1/6
𝛽 = P(x={2, 3, 4, 5, 6} ; H₁) = 1/4 + 1/2 = 3/4
𝛼 + 𝛽 = 0.916

3. {1, 2, |, 3, 4, 5, 6}
𝛼 = P(x={1, 2} ; H₀) = 1/3
𝛽 = P(x={3, 4, 5, 6} ; H₁) = 1/2
𝛼 + 𝛽 = 0.833

4. {1, 2, 3, |, 4, 5, 6}
𝛼 = P(x={1, 2, 3} ; H₀) = 1/2
𝛽 = P(x={4, 5, 6} ; H₁) = 3/8
𝛼 + 𝛽 = 0.875

5. {1, 2, 3, 4, |, 5, 6}
𝛼 = P(x={1, 2, 3, 4} ; H₀) = 2/3
𝛽 = P(x={5, 6} ; H₁) = 1/4
𝛼 + 𝛽 = 0.916

6. {1, 2, 3, 4, 5, |, 6}
𝛼 = P(x={1, 2, 3, 4, 5} ; H₀) = 5/6
𝛽 = P(x={6} ; H₁) = 1/8
𝛼 + 𝛽 = 0.958

6. {1, 2, 3, 4, 5, 6, |}
𝛼 = P(x={1, 2, 3, 4, 5, 6} ; H₀) = 1
𝛽 = P(x={} ; H₁) = 0
𝛼 + 𝛽 = 1

I 类和 II 类谬误及其不同边界总和的图如下所示:

能够看出,对于似然比测验失去的临界比值的最优值,Ⅰ类和Ⅱ类谬误之和最小。

换句话说,对于给定的谬误回绝概率,似然比测验提供了最小可能的谬误承受概率。

4. 间断散布

在下面的例子中,咱们没有探讨如何抉择临界比的值。概率分布是离散的,因而临界比率的渺小变动不会影响边界。

当咱们解决间断散布时,咱们固定谬误回绝概率的值并据此计算临界比率。

P(L(X) > 𝜉 ; H₀) = 𝛼

但同样,过程将是雷同的。一旦咱们取得临界比率的值,咱们就拆散察看空间。

𝛼的典型抉择是 𝛼 = 0.01、𝛼 = 0.05 或 𝛼 = 0.01,具体取决于谬误回绝的不良水平。

例如,如果咱们正在解决正态分布,咱们能够对其进行标准化并查找 Z 表以找到给定的值。

总结

在本文中,咱们理解了假设检验背地的概念和过程。整个过程能够总结为下图:

咱们从两个假如 H₀ 和 H₁ 开始,使得根底数据的散布取决于假如。指标是通过找到将察看值 x 的已实现值映射到两个假如之一的决策规定来证实或反驳原假如 H₀。最初,咱们计算与决策规定相干的误差。


欢送 Star -> 学习目录


本文由 mdnice 多平台公布

退出移动版