貝葉斯決策論在機(jī)器學(xué)習(xí),模式識(shí)別等諸多關(guān)注數(shù)據(jù)分析的領(lǐng)域都有著極為重要的地位,對(duì)貝葉斯定理進(jìn)行近似求解,為機(jī)器學(xué)習(xí)算法的涉及提供了一種有效的途徑,為了避免貝葉斯定理求解的時(shí)候面臨的組合爆炸,樣本稀疏問(wèn)題。樸素貝葉斯分類器引入了屬性條件獨(dú)立性假設(shè),這個(gè)假設(shè)在現(xiàn)實(shí)應(yīng)用中往往難以成立,但有趣的是,樸素貝葉斯分類器在很多情形下都能得到相當(dāng)好的性能,一種解釋是:只需要各類別的條件概率排序正確,無(wú)需精準(zhǔn)的概率值就可以導(dǎo)致正確分類的結(jié)果。另一種解釋是:若屬性之間的依賴對(duì)所有類別影響相同的時(shí)候,或者依賴關(guān)系的影響能夠相互的抵消,則屬性條件獨(dú)立性假設(shè)在降低計(jì)算開(kāi)銷的同時(shí)不會(huì)對(duì)性能產(chǎn)生負(fù)面影響。樸素貝葉斯分類器在信息檢索尤為常用,McCallum and igam在對(duì)文本分類中的兩種常見(jiàn)方法進(jìn)行了比較