五、朴素贝叶斯分类算法
生活随笔
收集整理的這篇文章主要介紹了
五、朴素贝叶斯分类算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.樸素貝葉斯分類算法的基本內容:
- 概率基礎
- 樸素貝葉斯分類器
樸素貝葉斯的核心思想是這樣的:對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個最大,就認為此待分類項屬于哪個類別。
2 概率基礎
2.1 隨機變量的先驗、條件、聯合概率
- 先驗概率:事件發生前的預判概率。P(X)
- 條件概率:一個事件發生后另一個事件發生的概率。P(X1lX2), P(X2lX1)
- 聯合概率:是指兩個事件同時發生的概率。X=(X1,X2), P(X)= P(X1,X2)
- 相關:P(X1,X2)= P(X2lX1)P(X1)= P(X1IX2)P(X2)
- 獨立:P(X1,X2)= P(X1)P(X2)
2.2 樸素貝葉斯的公式及其作用
- 貝葉斯公式打通從P(A|B)獲得P(B|A)的通路。
2.3 條件概率和聯合概率的計算
- 將一枚硬幣拋擲,觀察其出現正反面的情況.設事件A為“兩次擲出同一面",事件B為“至少有一次為正面".現在來求已知事件B已經發生的條件下事件A發生的概率。
3 樸素貝葉斯分類器
3.1 貝葉斯公式
- 一所學校里面有60%的男生,40%的女生。男生總是穿褲子,女生則一半穿褲子一半穿裙子。假設你走在校園中,前面走著一個穿褲子的學生,
- 問題1:你能夠推斷出他(她)是女生的概率是多大嗎?
- 分析:分析:現在假設學校里面人的總數為N。
- (1)男生中穿褲子的人數N*P(Boy)P(Pants| Boy)=N60%*100%;
- (2)女生中穿褲子的人數N*P(Girl)P(Pants| Girl) =N40%*50%;
- (3)穿褲子的總人數為:NP(Boy)P(Pants|Boy)+ NP(Girl) P(Pants|Girl)
3.2 推測穿褲子的學生是女生的概率
3.3 推測這個穿褲子的學生是男生還是女生
樸素貝葉斯的特征假設
- 計算后驗概率需用樸素貝葉斯假設:特征間相互獨立。
3.3 樸素貝葉斯的應用場景
- 垃圾文本過濾:垃圾郵件識別、社區評論信息檢測.
- 情感判別:微博的褒貶情緒 、電商評論信息的情感判斷.
- 文本分類:新聞文檔的自動識別。
總結
以上是生活随笔為你收集整理的五、朴素贝叶斯分类算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 四、自然语言处理的主要挑战
- 下一篇: 七、朴素贝叶斯中文文本分类