贝叶斯分类流程
樸素貝葉斯分類器的三個流程:
準備階段:
在這個階段我們需要確定特征屬性,比如對于通過“身高”為高、“體重”為中等、“鞋碼”為中等,這些特征 預測性別 問題中,對每個特征屬性進行適當劃分,然后由人工對一部分數據進行分類,形成訓練樣本。
訓練階段:
這個階段就是生成分類器,主要工作是計算每個類別在訓練樣本中的出現頻率及每個特征屬性劃分對每個類別的條件概率。輸入是特征屬性和訓練樣本,輸出是分類器。
應用階段:
這個階段是使用分類器對新數據進行分類。輸入是分類器和新數據,輸出是新數據的分類結果。
貝葉斯原理概念:
一、先驗概率:
通過經驗來判斷事情發生的概率 ,比如說“貝葉死”的發病率是萬分之一,就是先驗概率。再比如南方的梅雨季是 6-7 月,就是通過往年的氣候總結出來的經驗,這個時候下雨的概率就比其他時間高出很多。
二、后驗概率:
后驗概率就是發生結果之后,推測原因的概率。 比如說某人查出來了患有“貝葉死”,那么患病的原因可能是 A、B 或 C。患有“貝葉死”是因為原因 A 的概率就是后驗概率。它是屬于條件概率的一種。
三、條件概率:
事件 A 在另外一個事件 B 已經發生條件下的發生概率, 表示為 P(A|B),讀作“在 B 發生的條件下 A 發生的概率”。比如原因
總結
- 上一篇: 中科大23拟录取名单公布了吗?
- 下一篇: 机器学习概念