朴素贝叶斯分类(贝叶斯定理)典型案例:疾病诊断

2020年1月3日14:52:08朴素贝叶斯分类(贝叶斯定理)典型案例:疾病诊断已关闭评论

朴素贝叶斯分类是机器学习的一种方法,常用来解决分类问题。它是概率论在机器学习领域最重要的应用之一,其核心思想正是贝叶斯定理,也正是由于传承于形式简单的贝叶斯定理,我们才称为“朴素”贝叶斯分类。朴素贝叶斯分类常常应用于医学诊断,下面是一个典型案例。

疾病诊断

春天到了,北京街头飘起了杨絮,因为杨絮过敏而就医的人渐渐多了起来,春夏之交,流感盛行,因为感冒而就医的人也渐渐多了起来。从症状来看,杨絮过敏和感冒十分相似,医生怎样判断病人是过敏还是感冒呢?

表7-4是某医院门诊近期的就诊情况记录,近期该医院门诊共接待了20位病人,症状有“打喷嚏”和“咳嗽”两种,男女病人数量相同,所患疾病有“感冒”和“过敏”两种。就在这时,又来了一位病人,性别女,症状是打喷嚏,她患感冒的概率是多少?

朴素贝叶斯分类(贝叶斯定理)典型案例:疾病诊断

表7-4 某医院门诊就诊记录

如果不使用贝叶斯定理,我们可能会这样计算:表中11~15号病人与新来的病人症状相同,这5位病人中有1位患有感冒,因此新来的病人患感冒的概率是20%。

上述方法错在把“打喷嚏”和“性别女”作为一个条件来看待,它们本是两个彼此独立的条件,会各自独立地影响病人患感冒的概率,因此我们应当使用贝叶斯定理计算病人患感冒的概率。

由贝叶斯定理可得:

P(感冒|性别女且打喷嚏)=P(性别女且打喷嚏|感冒)·P(感冒)÷P(性别女且打喷嚏)

“性别女”和“打喷嚏”可以看作独立事件,因此:

P(感冒|性别女且打喷嚏)=P(性别女|感冒)·P(打喷嚏|感冒)×P(感冒)/[P(性别女)·P(打喷嚏)]

由表中数据可知:

P(感冒)=11/20;

P(性别女)=10/20;

P(打喷嚏)=11/20;

P(打喷嚏|感冒)=5/11;

P(性别女|感冒)=4/11。

将上面的数值代入贝叶斯定理的表达式,可以计算得到:

P(感冒|性别女且打喷嚏)=33%

P(过敏|性别女且打喷嚏)=67%

这便是使用朴素贝叶斯分类得到的诊断结果。

在实际应用中,医生掌握的病人信息会更多,医院的就诊记录也更多,但是朴素贝叶斯分类方法是不变的。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。