关于算法:个推漫话数据智能-天才基本法中的贝叶斯网络及原理解读

40次阅读

共计 2397 个字符,预计需要花费 6 分钟才能阅读完成。

最近的热播剧《蠢才基本法》中,提到了很多乏味的数学知识点,比方“亲和数”“巴什博奕”“孔明棋”“七桥问题”等等,让很多观众直呼不明觉厉。其中,最让 Mr.Tech 感兴趣的是剧中男女主加入数学建模大赛时用到的贝叶斯网络。

▲女主应用贝叶斯网络进行算法建模,来预测嫌犯口头轨迹和抓捕工夫方位。图片截图自电视剧《蠢才基本法》

贝叶斯网络是一种分类算法,被宽泛地利用于医疗诊断、风控等业务场景中,并施展着重要作用。对于“贝叶斯网络”,你理解多少?明天个推就和大家一起走进机器学习畛域,独特学习这个神奇的算法模型。

一、走进贝叶斯网络

生存中,人们往往会从最终的后果反向揣测其起因,从而更好地做危险躲避,或提前发明充分条件以达成预期指标。不过事物之间的分割往往盘根错节,咱们如何抽丝剥茧,清晰剖析出事件和事件之间的相互依赖关系?是否有可能通过数学的形式来计算和掂量其中的因果作用,帮忙咱们追溯甚至预测事物的走向?贝叶斯网络就是当下数据科学家和算法工程师用来解决此类问题的一种无效形式。

 贝叶斯网络(bayesian network)是形容随机变量(事件)之间关系的模型。例如,贝叶斯网络能够示意疾病和症状之间的概率关系。依据症状,该网络能够计算各种疾病存在的概率。

贝叶斯网络用有向无环图 (Directed Acyclic Graph,DAG) 示意,其中每个节点代表一个随机变量,节点间的分割用有向箭头示意,箭头从“因节点”指向“被影响节点”,用条件概率表白关系强度。

事实中,医生的诊断过程和贝叶斯网络的推理机制高度一致。如上图,如果患者咳嗽十分重大,甚至呈现气急、呼吸不畅等症状,医生联合雾霾天气、患者的吸烟史等状况,初步判断患者可能得了肺炎。接下来医生会要求患者拍肺部的 X 光片,依据患者的 X 光片体现,做出更加迷信的诊断论断。

目前,很多医疗辅助零碎正是基于贝叶斯网络,将过往的医学诊断教训很好地积淀下来,实现智能诊断,帮忙医生大幅晋升诊断效率。

接下来,咱们再深刻理解更深层次的问题:贝叶斯网络如何量化和计算事件之间的因果 / 条件依赖关系?在上述案例中,雾霾、吸烟、过敏、病菌感化等都是导致患者得肺炎的危险因子。那么哪一个危险因子的影响作用最大?这就须要咱们了解贝叶斯网络的底层数学思维——贝叶斯定理。

二、贝叶斯网络与贝叶斯定理

贝叶斯定理由英国驰名数学家托马斯·贝叶斯提出,它是对于条件概率的定理,公式如下:

依据高中的概率论常识来了解贝叶斯公式:P(A), P(B) 示意事件 A 和事件 B 的独立产生概率。P(A|B) 是个条件概率,示意当事件 B 产生的状况下,事件 A 产生的概率。P(B|A) 也是个条件概率,示意当事件 A 产生的状况下,事件 B 产生的概率。

贝叶斯定理中有先验概率和后验概率之分。

先验概率:指依据以往教训和统计分析失去的概率。是在“后果”产生之前的概率,比方公式中的 P(A)就是先验概率。先验概率个别作为“由因求果”问题中的“因”呈现。

后验概率:是依据察看到的样本修改之后的概率值。指在后果产生之后,咱们依据“后果”来计算和剖析最有可能导致该后果的起因,即“执果寻因”中的“因”。公式中的 P(A|B)就是后验概率。

接下来,咱们将方才提到的医疗诊断实例简化,来进一步了解贝叶斯定理。

假如(先验概率均为假如数据):
患者病菌感化的概率 P(V) = 5%
患者感冒的概率 P(C) = 30%
患者因为病菌感化而感冒的概率 P(C|V) = 40%

那么:依据贝叶斯定理,感冒患者被病菌感化的后验概率 P(V|C) = P(C|V)P(V) / P(C) = 40%5% / 30% ≈66.67% 再简单一些。

假如(先验概率均为假如数据):患者发热的概率 P(F) = 6%
患者因为感冒而发热的概率 P(F|C) = 60%
那么:患者因为病菌感化而发热的概率 P(F|V) = P(C|V) * P(F|C) = 24%
那么:依据贝叶斯定理,发热患者被病菌感化的后验概率 P(V|F) = P(F|V)P(V) / P(F) = 24%5% / 6% =20% 

如上,贝叶斯网络其实就是基于贝叶斯定理对事物之间因果关系以及依赖关系进行量化,并使得因果或依赖关系的强弱能够被推理和计算。

在解决理论业务问题时,算法工程师们往往会通过对历史数据进行统计失去先验概率,而后应用贝叶斯网络进行推理,实现对机器故障起因、患者病因等的智能剖析,以及对机器设备故障概率、患者患病危险等的预测。

只不过,在理论的机器学习过程中,算法工程师们须要计算的数据量十分宏大,所构建的贝叶斯网络更为简单。

贝叶斯定理与人类大脑的推理过程十分类似,作为人工智能畛域学习和推理的重要分支,贝叶斯定理始终备受关注。而以贝叶斯定理为根底的贝叶斯网络由 Judea Pearl 于 1986 年提出,是近年来机器学习畛域的钻研热点。2011 年,Judea Pearl 还凭借在人工智能以及贝叶斯网络方面的奉献,取得了“计算机界的诺贝尔奖”——图灵奖。

以后,算法工程师们对贝叶斯网络的钻研偏重在构造学习方面,心愿可能构建起更加主观、牢靠的网络模型,更好地施展出贝叶斯网络在不确定性推理方面的劣势。

互动交换:你对贝叶斯网络理解多少?欢送公众号后盾留言,和咱们谈谈你的了解~ 

结语:

《蠢才基本法》中,女主胜利利用贝叶斯网络和贝叶斯定理解决了疑犯轨迹预测和追踪的问题。而在事实世界,人们对大数据和 AI 技术的利用更加深刻,一直摸索应用数据智能技术解决各种不确定问题,比方基于丰盛、实时的数据构建动静贝叶斯网络,帮忙相干部门预测公共突发事件的影响,撑持应急治理等等。

作为一家数据智能企业,个推也始终走在技术创新的前沿。通过对海量数据进行深度治理和开掘,个推将数据加工为信息和常识,解读出数据的人文涵义,从而更好地服务行业客户和政府相干部门,助力科学决策。

想要理解更少数智前沿技术?继续关注个推技术实际“漫话 DI”系列专栏,和 Mr.Tech 一起近距离感触数智魅力~

正文完
 0