数据挖掘复习笔记043分类问题之-Naive-Bayes

24次阅读

共计 369 个字符,预计需要花费 1 分钟才能阅读完成。

分类问题之 Naive Bayes

简介

  • 条件概率

    P(A|B)*P(B) = P(A, B) = P(B|A)*P(A)

  • 全概率公式

  • 分类步骤

     朴素贝叶斯假设特征之间相互独立
    1. 计算 P(A|C0) = P(A1, A2, A3|C0) = P(A1|C0) * P(A2|C0) * P(A3|C0)
    2. 计算 P(A|C1) = P(A1, A2, A3|C1) = P(A1|C1) * P(A2|C1) * P(A3|C1)
    3. 计算 P(A, C0) = P(A|C0) * P(C0)
    4. 计算 P(A, C1) = P(A|C1) * P(C1)
    5. 不需要计算分母的 P(A)
    6. 如果 P(A, C0) > P(A, C1), 那么可以得出 P(C0|A) > P(C1|A), 即样例属于 C0 类 

优缺点

  • 抗噪,对孤立噪点噪声鲁棒
  • 对不相关的属性有较强的鲁棒性
  • 如果某条记录存在缺失值, 之间忽略即可
  • 朴素贝叶斯假设特征之间相互独立,但实际情况并不一定如此

正文完
 0