朴素贝叶斯知识点概括
1. 簡述
貝葉斯是典型的生成學(xué)習(xí)方法
對于給定的訓(xùn)練數(shù)據(jù)集,首先,基于特征條件獨立假設(shè),學(xué)習(xí)輸入/輸出的聯(lián)合概率分布;然后,基于此模型,對于給定的輸入x,根據(jù)貝葉斯定理求后驗概率最大的輸出y
術(shù)語說明:
- 特征條件獨立假設(shè):用于分類的特征在類確定的條件下都是條件獨立的。這一假設(shè)大大減少模型包含的條件概率數(shù)量,簡化了貝葉斯方法的學(xué)習(xí)與預(yù)測
- 聯(lián)合概率分布:即先驗概率和條件概率(條件獨立性假設(shè),重要知識點)
- 學(xué)習(xí)聯(lián)合概率分布的方法:學(xué)習(xí)就是指估計先驗概率和條件概率,具體方法有極大似然估計、貝葉斯估計(貝葉斯估計是為了避免極大似然估計出現(xiàn)概率為0的情況,影響計算)
- 后驗概率最大:等價于期望風(fēng)險最小化
2 條件概率的估計
摘自http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html
計算出各個劃分的條件概率是樸素貝葉斯分類的關(guān)鍵,當(dāng)特征是離散值時,統(tǒng)計出現(xiàn)頻率即可,下面討論連續(xù)值的情況
當(dāng)特征屬性為連續(xù)值時,通常假定其值服從高斯分布(也稱正態(tài)分布)。即:
??????
????? 而
????? 因此只要計算出訓(xùn)練樣本中各個類別中此特征項劃分的各均值和標(biāo)準(zhǔn)差,代入上述公式即可得到需要的估計值
代碼:https://github.com/yundou2017/bayes/blob/master/Bayes2.m
優(yōu)缺點
- 優(yōu)點:在數(shù)據(jù)較少的情況下仍然有效,可以處理多類別問題
- 缺點:對于輸入數(shù)據(jù)的準(zhǔn)備方式較為敏感
轉(zhuǎn)載于:https://www.cnblogs.com/xiaoyun94/p/6727404.html
總結(jié)
以上是生活随笔為你收集整理的朴素贝叶斯知识点概括的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: “争及此花檐户下”下一句是什么
- 下一篇: 关于打开新链接,用当前页还是用新页面?