关于人工智能:假设检验使用p值来接受或拒绝你的假设

作者|GUEST
编译|VK
起源|Analytics Vidhya

介绍

测验是统计学中最根本的概念之一。不仅在数据迷信中，假设检验在各个领域都很重要。想晓得怎么做？让咱们举个例子。当初有一个lifebuoy沐浴露。

沐浴露厂商宣称，它杀死99.9%的细菌。他们怎么能这么说呢？必须有一种测试技术来证实这种说法是正确的。所以假设检验用来证实一个主张或任何假如。

假设检验的定义

假如是对于参数值（均值、方差、中值等）的陈说、假如或主张。

假如是对你四周世界的某件事的有依据的猜想。它应该能够通过试验或察看来测试。

比如说，如果咱们说“多尼是有史以来最好的印度队长”，这是一个假如，咱们是依据他负责队长期间球队的均匀输赢状况做出的。咱们能够依据所有的匹配数据来测试这个语句。

零假如和代替假设检验

零假如是在假如为真的前提下，测验假如是否可能被回绝。相似无罪的概念。咱们假设无罪，直到咱们有足够的证据证实嫌疑人有罪。

简略地说，咱们能够把零假如了解为曾经被承受的陈说，例如，天空是蓝色的。咱们曾经承受这个申明。

用H0示意。

代替假如补充了零假如。它与原假如相同，代替假如和原假如一起笼罩了总体参数的所有可能值。

用H1示意。

让咱们用一个例子来了解这一点：

一家肥皂公司宣称他们的产品均匀杀死99%的细菌。为了测验这家公司的主张，咱们将提出零和代替假如。

零假如（H0）：平均值等于99%

代替假如（H1）：平均值不等于99%。

留神:当咱们测验一个假如时，咱们假如原假如是真的，直到样本中有足够的证据证实它是假的。在这种状况下，咱们回绝原假如而反对代替假如。

如果样本不能提供足够的证据让咱们回绝零假如，咱们不能说零假如是真的，因为它仅仅基于样本数据。零假如成立须要钻研整个总体数据。

简略假设检验和复合假设检验

当一个假如指定了参数的准确值时，这是一个简略的假如，如果它指定了一个值的范畴，则称为复合假如。例如

某电单车公司宣称某车型每升均匀行驶里程为100公里，这是一个简略假如的案例。
一个班学生的平均年龄大于20岁。这是一个复合假如。

单尾和双尾假设检验

如果代替假如在两个方向（小于和大于）给出了在零假如中指定的参数值的代替，则称为双尾测验。

如果代替假如只在一个方向（小于或大于）给出了在零假如中指定的参数值的代替，则称为单尾检验。例如

H0：平均值等于100
H1：平均值不等于100

依据H1，平均值能够大于或小于100。这是一个双尾测验的例子

同样，

H0：平均值>=100
H1：平均值<100

在这里，平均值不到100。这叫做单尾检验。

拒绝域

拒绝域是样本空间中的回绝区域，如果计算值在其中，那么咱们就回绝零假如。

让咱们用一个例子来了解这一点：

假如你想租一套公寓。你从不同的实在国家网站列出了所有可用的公寓。你的估算是15000卢比/月。你不能再花那么多钱了。你所订的公寓清单的价格从7000/月到30000/月不等。

你从列表中随机抉择一个公寓，并假如以下假如：

H0:你要租这套公寓。
H1:你不会租这套公寓。

当初，既然你的估算是1.5万，你必须回绝所有高于这个价格的公寓。

在这里所有价格超过15000成为你的拒绝域。如果随机公寓的价格在这个区域，你必须回绝你的零假如，如果公寓的价格不在这个区域，你就不能回绝你的零假如。

依据代替假如，拒绝域位于概率分布曲线的一条或两条尾巴上。拒绝域是与概率分布曲线中的截止值绝对应的预约义区域。用α示意。

临界值是将反对或回绝零假如的值分隔开的值，并依据alpha进行计算。

稍后咱们将看到更多的例子，咱们将分明地晓得如何抉择α。

依据另一种假如，拒绝域呈现了三种状况：

案例1）这是一个双尾测验。

案例2）这种状况也被称为左尾测验。

案例3）这种状况也被称为右尾测验。

I型和II型谬误

因而，第一类和第二类谬误是假设检验的重要课题之一。让咱们把这个话题分解成更小的局部来简化它。

一个假正例（I型谬误）——当你回绝一个真的零假如时。

假负性（II型谬误）——当你承受一个谬误的零假如时。

犯I型谬误（假正例）的概率等于临界区α的显著性程度或大小。
α=P[当H0为真时回绝H0]
犯II型谬误（假阴性）的概率等于β。
β=P[当H1为真时不回绝H0]

例子：

这个人因犯有入室盗窃罪而被捕。由法官组成的陪审团必须裁定有罪或无罪。

H0：人是无辜的

H1：人有罪

第一类谬误是如果陪审团断定某人有罪[拒绝接受H0]，只管此人是无辜的[H0是真的]。

第二类谬误将是当陪审团开释该人[不回绝H0]尽管该人有罪[H1是真的]。

统计学意义

为了了解这个话题，让咱们思考一个例子：假如有一家糖果厂每天生产500克的糖果。工厂培修后的一天，一名工人宣称他们不再生产500克的糖果，可能是少了或多了。

那么，这名工人凭什么声称这一谬误？那么，咱们应该在哪里画一条线来决定糖果条分量的变动呢？这一决定/界线在统计学上具备重要意义。

置信水平

顾名思义，咱们有多自信：咱们在做决定时有多自信。LOC（置信水平）应大于95%。不承受低于95%的置信度。

显著性程度（α）

显著性程度，用最简略的术语来说，就是当事实上是真的时，谬误地回绝零假如的临界概率。这也称为I型错误率。

这是I类谬误的概率。它也是拒绝域的大小。

一般来说，在测试中，它是非常低的程度，如0.05（5%）或0.01（1%）。

如果H0在5%的显著性程度上没有被回绝，那么咱们能够说咱们的零假如是正确的，有95%的把握。

P值

假如咱们在1%的显著性程度上进行假设检验。

H0：平均值<X（咱们只是假如一个单尾检验的状况。）

咱们失去临界值（基于咱们应用的测试类型），发现咱们的测试统计值大于临界值。因而，咱们必须在这里回绝零假如，因为它位于拒绝域。

如果零假如在1%时被回绝，那么能够必定的是，在更高的显著性程度上，比方5%或10%，它会被回绝。

如果咱们的显著性程度低于1%，那么咱们是否也必须回绝咱们的假如呢？

是的，有可能产生上述情况，而“p值”正在发挥作用。

p值是能够回绝零假如的最小显著性程度。

这就是为什么当初很多测试都给出p值，而且它更受欢迎，因为它给出的信息比临界值更多。

对于右尾测验：
p值=P[测验统计量>=测验统计量的察看值]
对于左尾测验：
p值=p[测验统计量<=测验统计量的察看值]
对于双尾测验：
p值=2*p[测验统计量>=|测验统计量的察看值|]

p值决策

咱们比拟p值和显著性程度（alpha）对零假如做出决定。

如果p值大于alpha，咱们不回绝零假如。
如果p值小于alpha，咱们回绝零假如。

原文链接：https://www.analyticsvidhya.c…

欢送关注磐创AI博客站：
http://panchuang.net/

sklearn机器学习中文官网文档：
http://sklearn123.com/

欢送关注磐创博客资源汇总站：
http://docs.panchuang.net/

关于人工智能:假设检验使用p值来接受或拒绝你的假设

介绍

目录

假设检验的定义

零假如和代替假设检验

简略假设检验和复合假设检验

单尾和双尾假设检验

拒绝域

I型和II型谬误

统计学意义

置信水平

显著性程度（α）

P值

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于人工智能:假设检验使用p值来接受或拒绝你的假设

介绍

目录

假设检验的定义

零假如和代替假设检验

简略假设检验和复合假设检验

单尾和双尾假设检验

拒绝域

I型和II型谬误

统计学意义

置信水平

显著性程度（α）

P值

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复