关于机器学习:联合概率和条件概率的区别和联系

41次阅读

共计 2503 个字符,预计需要花费 7 分钟才能阅读完成。

联结概率 P(A∩B)

两个事件一起(或顺次)产生的概率。

例如:掷硬币的概率是 ¹⁄₂ = 50%,翻转 2 个偏心硬币的概率是 ¹⁄₂ × ¹⁄₂ = ¹⁄₄ = 25%(这也能够了解为 50% 的 50%)

P(A ∩ B) = P(A) ⋅ P(B)

对于 2 个硬币,样本空间将是 4 {HH,HT,TH,TT},如果第一个硬币是 H,那么残余的后果是 2 {HT,HH}。这意味着第一个事件可能会影响第二个事件。

例如:从 10 个不同色彩的球中选出 1 个绿球的概率是 ¹⁄₁₀,10 个球当选 2 个绿球的概率(2 个绿、2 个蓝、2 个红、4 个黄)²⁄₁₀ × ¹⁄₉(这个排列组合会更分明)

简而言之。当第一个事件的产生影响第二个事件的产生时,它们是相干事件。

P(A ∩ B) = P(A) ⋅ P(B|A)

这里,P(B|A) 被读作 在 A 之后产生 B 的概率。这是当 A 事件曾经产生时产生 B 事件的概率。这称为条件概率。

联结概率和条件概率

例:城市中的一个三角形区域被化学工业净化。有 2% 的孩子住在这个三角区。其中 14% 的检测适量有毒金属呈阳性,而不在三角区寓居的城市儿童的阳性检测率仅为 1%。

思考:T 示意寓居在三角形区域的人,并且 P 示意检测呈阳性的人。

当它说区域中 14% 的孩子测试为阳性时,这意味着:如果从三角形中随机抽取一个孩子,它将有 14% 的机会测试为阳性。这是 P(P∣T)

P(P∩T) 的解释是自整个人口中随机抉择后即在三角形中并且测试为阳性的概率。

用维恩图了解

P(A∩B) 是 A 和 B 都产生的概率(没有任何附加信息。)

P(A|B) 是如果咱们晓得 B 曾经产生,A 产生的概率。

让咱们通过一个例子来了解它。一个班有 60 名学生。33 个喜爱蓝色,23 个喜爱红色,20 个学生喜爱这两种色彩,4 个学生喜爱橙色。

1、选出一个同时喜爱红和蓝色彩的学生的概率是多少?

这非常简单:P(B ∩ R) = ²⁰⁄₆₀

2、从喜爱红色的学生中选出一个喜爱蓝色的学生的概率是多少?

咱们将查看从特定学生集中抉择具备特定抉择的学生的概率。

⇒ 喜爱红色的学生有 23 人。其中有 20 个喜爱这两种色彩。

P(B | R) =²⁰⁄₂₃

通过维恩图和下面的例子,咱们能够说在这两种状况下,事件的后果都没有扭转,但样本空间正在缩小。因而,

𝐏(𝐀∣𝐁) ≥𝐏(𝐀∩𝐁)

更多的例子

例子 1:

假如掷两个骰子,第一个失去 6 第二个失去 4 的概率是多少? 假如掷两个骰子,如果两个骰子的数字之和是 10,第二个骰子显示 4 的概率是多少?

在第一种状况下,没有给出定义样本空间的条件。所以咱们从两个骰子中取可能的后果,也就是 36。

P(a∩b) = 2/36

在第二种状况下,对于样本空间有一个条件,即骰子上的两个数的样本空间总和为 10。样本空间的总元素只有 3 {4+6,5+5,6+4}

P(a | b) = 1/3

例子 2:

一个人正在过马路,咱们想计算他被路过的汽车撞到的概率,这取决于交通灯的色彩。

设 H 代表这个人是否被撞,C 代表红绿灯的色彩。

H ={撞, 不撞}

C ={红、黄、绿}。

在这种状况下,你被撞到的条件概率是概率 P(H= 撞到 |C= 红色),即假如灯是红色的,你被车撞到的概率有多大。

即便不是红灯,也有可能有人被撞到,但这里咱们只思考红灯时产生的车祸。

而联结概率则是 P(H= 撞到,C= 红色),即红灯亮时你被车撞到的概率。

假如一个人横穿马路 3 次而没有产生事变。但第 7 次被撞了。如果应用联结概率,咱们还想晓得当他被撞时灯是红色的概率是多少。

当初如果咱们说,他在红灯时过马路 10 次,被车撞了 7 次。在这种状况下,样本空间的条件是曾经给定的。

例子 3:

钻研人员考察了 100 名学生,询问他们最想领有哪种超能力。这个双表格显示了参加考察的学生样本的数据:

咱们来找出不同的概率;

1、找出学生抉择航行作为他们超能力的概率。

没有给出样本空间的条件。咱们取所有学生 (100) 来计算概率。

P(fly) = 38/100 = 0.38

2、求出该学生是男性的概率。

同样,没有给出样本空间的条件。咱们取所有学生 (100) 来计算概率。

P(male)= 48/100 = 0.48

3、求抉择航行作为超能力时,这个学生是男性的概率。

这很乏味,这个问题的样本空间是一群想要航行的学生。

n (S) = 38

38 名学生中有 26 名是男性。所以

P(male∣fly) = 26/38 = 0.68

或者用条件概率公式

P(male∩fly) = 抉择航行男生 / 总人数 = 26/100

P(male∣fly)= P(male∩fly)/ P(fly)= 26/38 = 0.68

4、假如该学生是男性,求出该学生抉择航行的概率。

这和上一题差不多。这个问题的样本空间为 n(S) = 48。在 48 名学生中,有 26 人抉择航行。所以

P(male∣fly) = 26/48 =0.68

5、I 代表一个学生抉择隐身作为超能力的事件,F 代表一个学生是女性的事件。

解释 P(I∣F)≈0.62 的含意;

a、大概 62% 的女性抉择隐身作为她们的超能力。

b、在抉择隐身作为本人超能力的人中,大概有 62% 是女性。

解释如下:

n(S) = 所有女性,I∣F 能够被解读为在所有女性中抉择隐身的人。

总的来说,咱们能够了解为大概 62% 的女性抉择隐身作为她们的超能力。所以表述 a 是正确的。

例子 4:

下表是将各国按地区和均匀守业老本 (占某一年人均国民总收入(GNI) 的百分比)进行了分类。

思考到如果该国的守业老本归类为高,那么找出该国位于南亚地区的概率。

这个问题属于条件概率,因为给定了抉择样本空间的条件:守业老本高的国家 n(S) = 87(样本空间),以上样本空间中的南亚地区国家,即守业老本高的国家:7

所以,从守业老本高的国家中抉择南亚地区国家的概率 = 7/87

如果咱们用条件概率的公式

咱们能够先计算 P(A ∩ B),即从所有南亚地区且守业老本高的国家中抉择一个国家的概率。

这样的国家有 7 个。因为没有定义抉择样本空间的条件,咱们将采纳全副空间,即 n(S) = 188。

P(A ∩ B) = 7/188

当初,咱们须要计算一个国家守业老本高的概率。这很简略

P(A) = 87/188

应用公式 失去 P(B|A) = 7/87

总结

心愿本文能够解释联结概率和条件概率之间区别和分割,感激浏览。

https://avoid.overfit.cn/post/eefc0494e581455cba52336e8c57ff8e

正文完
 0