【学习笔记】《数据挖掘:理论与算法》CH3 从贝叶斯到决策树
生活随笔
收集整理的這篇文章主要介紹了
【学习笔记】《数据挖掘:理论与算法》CH3 从贝叶斯到决策树
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
分類問題
樸素貝葉斯分類
需要假設條件獨立
- 肺癌和性別的關系,不能簡單說男性得肺癌的概率大于女性,需要考慮得肺癌的條件:抽煙,
在抽煙的情況下,得肺癌的概率大于不抽煙的情況。 - 拋硬幣問題,一枚正常硬幣,一枚雙面相同的硬幣,拋硬幣概率不同。
拉普拉斯平滑:樣本加1
文本推薦:統計感興趣文本中單詞出現的概率,當新出現一個文本時,通過計算文本中單詞出現的概率,來推測對文本感興趣的概率。
決策樹
決策樹算法
ID3 (Iterative Dichotomizer 3)
迭代劃分,確定屬性節點,確定停止條件
計算熵值,熵值最大為1,越大越表示不確定
計算信息增益,信息增益越大越好,越能區分 -> 確定屬性
軟件:
Naive Bayes algorithm for learning to classify text
http://www.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
總結
以上是生活随笔為你收集整理的【学习笔记】《数据挖掘:理论与算法》CH3 从贝叶斯到决策树的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PyTorch机器学习从入门到实践-CH
- 下一篇: 【学习笔记】《数据挖掘:理论与算法》CH