作者 |GUEST
编译 |VK
起源 |Analytics Vidhya
介绍
测验是统计学中最根本的概念之一。不仅在数据迷信中,假设检验在各个领域都很重要。想晓得怎么做?让咱们举个例子。当初有一个 lifebuoy 沐浴露。
沐浴露厂商宣称,它杀死 99.9% 的细菌。他们怎么能这么说呢?必须有一种测试技术来证实这种说法是正确的。所以假设检验用来证实一个主张或任何假如。
目录
- 假设检验的定义
- 零和代替假设检验
- 简略假设检验和复合假设检验
- 单尾和双尾测验
- 临界区
- I 型和 II 型谬误。
- 统计学意义
- 信念程度
- 重要水平
- P 值
这个博客将这些概念分解成小局部,这样你就能了解它们的动机和用处。当你读完这个博客,假设检验的基础知识就会很分明了!!
假设检验的定义
假如是对于参数值(均值、方差、中值等)的陈说、假如或主张。
假如是对你四周世界的某件事的有依据的猜想。它应该能够通过试验或察看来测试。
比如说,如果咱们说“多尼是有史以来最好的印度队长”,这是一个假如,咱们是依据他负责队长期间球队的均匀输赢状况做出的。咱们能够依据所有的匹配数据来测试这个语句。
零假如和代替假设检验
零假如是在假如为真的前提下,测验假如是否可能被回绝。相似无罪的概念。咱们假设无罪,直到咱们有足够的证据证实嫌疑人有罪。
简略地说,咱们能够把零假如了解为曾经被承受的陈说,例如,天空是蓝色的。咱们曾经承受这个申明。
用 H0 示意。
代替假如补充了零假如。它与原假如相同,代替假如和原假如一起笼罩了总体参数的所有可能值。
用 H1 示意。
让咱们用一个例子来了解这一点:
一家肥皂公司宣称他们的产品均匀杀死 99% 的细菌。为了测验这家公司的主张,咱们将提出零和代替假如。
零假如(H0):平均值等于 99%
代替假如(H1):平均值不等于 99%。
留神: 当咱们测验一个假如时,咱们假如原假如是真的,直到样本中有足够的证据证实它是假的。在这种状况下,咱们回绝原假如而反对代替假如。
如果样本不能提供足够的证据让咱们回绝零假如,咱们不能说零假如是真的,因为它仅仅基于样本数据。零假如成立须要钻研整个总体数据。
简略假设检验和复合假设检验
当一个假如指定了参数的准确值时,这是一个简略的假如,如果它指定了一个值的范畴,则称为复合假如。例如
- 某电单车公司宣称某车型每升均匀行驶里程为 100 公里,这是一个简略假如的案例。
- 一个班学生的平均年龄大于 20 岁。这是一个复合假如。
单尾和双尾假设检验
如果代替假如在两个方向(小于和大于)给出了在零假如中指定的参数值的代替,则称为双尾测验。
如果代替假如只在一个方向(小于或大于)给出了在零假如中指定的参数值的代替,则称为单尾检验。例如
- H0:平均值等于 100
- H1:平均值不等于 100
依据 H1,平均值能够大于或小于 100。这是一个双尾测验的例子
同样,
- H0:平均值 >=100
- H1:平均值 <100
在这里,平均值不到 100。这叫做单尾检验。
拒绝域
拒绝域是样本空间中的回绝区域,如果计算值在其中,那么咱们就回绝零假如。
让咱们用一个例子来了解这一点:
假如你想租一套公寓。你从不同的实在国家网站列出了所有可用的公寓。你的估算是 15000 卢比 / 月。你不能再花那么多钱了。你所订的公寓清单的价格从 7000/ 月到 30000/ 月不等。
你从列表中随机抉择一个公寓,并假如以下假如:
- H0: 你要租这套公寓。
- H1: 你不会租这套公寓。
当初,既然你的估算是 1.5 万,你必须回绝所有高于这个价格的公寓。
在这里所有价格超过 15000 成为你的拒绝域。如果随机公寓的价格在这个区域,你必须回绝你的零假如,如果公寓的价格不在这个区域,你就不能回绝你的零假如。
依据代替假如,拒绝域位于概率分布曲线的一条或两条尾巴上。拒绝域是与概率分布曲线中的截止值绝对应的预约义区域。用 α 示意。
临界值是将反对或回绝零假如的值分隔开的值,并依据 alpha 进行计算。
稍后咱们将看到更多的例子,咱们将分明地晓得如何抉择 α。
依据另一种假如,拒绝域呈现了三种状况:
案例 1 )这是一个双尾测验。
案例 2 )这种状况也被称为左尾测验。
案例 3 )这种状况也被称为右尾测验。
I 型和 II 型谬误
因而,第一类和第二类谬误是假设检验的重要课题之一。让咱们把这个话题分解成更小的局部来简化它。
一个假正例(I 型谬误)——当你回绝一个真的零假如时。
假负性(II 型谬误)——当你承受一个谬误的零假如时。
- 犯 I 型谬误(假正例)的概率等于临界区 α 的显著性程度或大小。
α=P[当 H0 为真时回绝 H0]
- 犯 II 型谬误(假阴性)的概率等于 β。
β=P[当 H1 为真时不回绝 H0]
例子:
这个人因犯有入室盗窃罪而被捕。由法官组成的陪审团必须裁定有罪或无罪。
H0:人是无辜的
H1:人有罪
第一类谬误是如果陪审团断定某人有罪[拒绝接受 H0],只管此人是无辜的[H0 是真的]。
第二类谬误将是当陪审团开释该人 [不回绝 H0] 尽管该人有罪[H1 是真的]。
统计学意义
为了了解这个话题,让咱们思考一个例子:假如有一家糖果厂每天生产 500 克的糖果。工厂培修后的一天,一名工人宣称他们不再生产 500 克的糖果,可能是少了或多了。
那么,这名工人凭什么声称这一谬误?那么,咱们应该在哪里画一条线来决定糖果条分量的变动呢?这一决定 / 界线在统计学上具备重要意义。
置信水平
顾名思义,咱们有多自信:咱们在做决定时有多自信。LOC(置信水平)应大于 95%。不承受低于 95% 的置信度。
显著性程度(α)
显著性程度,用最简略的术语来说,就是当事实上是真的时,谬误地回绝零假如的临界概率。这也称为 I 型错误率。
这是 I 类谬误的概率。它也是拒绝域的大小。
一般来说,在测试中,它是非常低的程度,如 0.05(5%)或 0.01(1%)。
如果 H0 在 5% 的显著性程度上没有被回绝,那么咱们能够说咱们的零假如是正确的,有 95% 的把握。
P 值
假如咱们在 1% 的显著性程度上进行假设检验。
H0:平均值 <X(咱们只是假如一个单尾检验的状况。)
咱们失去临界值(基于咱们应用的测试类型),发现咱们的测试统计值大于临界值。因而,咱们必须在这里回绝零假如,因为它位于拒绝域。
如果零假如在 1% 时被回绝,那么能够必定的是,在更高的显著性程度上,比方 5% 或 10%,它会被回绝。
如果咱们的显著性程度低于 1%,那么咱们是否也必须回绝咱们的假如呢?
是的,有可能产生上述情况,而“p 值”正在发挥作用。
p 值是能够回绝零假如的最小显著性程度。
这就是为什么当初很多测试都给出 p 值,而且它更受欢迎,因为它给出的信息比临界值更多。
- 对于右尾测验:
p 值 =P[测验统计量 >= 测验统计量的察看值]
- 对于左尾测验:
p 值 =p[测验统计量 <= 测验统计量的察看值]
- 对于双尾测验:
p 值 =2*p[测验统计量 >=| 测验统计量的察看值 |]
p 值决策
咱们比拟 p 值和显著性程度(alpha)对零假如做出决定。
- 如果 p 值大于 alpha,咱们不回绝零假如。
- 如果 p 值小于 alpha,咱们回绝零假如。
原文链接:https://www.analyticsvidhya.c…
欢送关注磐创 AI 博客站:
http://panchuang.net/
sklearn 机器学习中文官网文档:
http://sklearn123.com/
欢送关注磐创博客资源汇总站:
http://docs.panchuang.net/