當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【数据挖掘】数据挖掘总结 ( 贝叶斯分类器示例 ) ★

發(fā)布時間：2023/12/20 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了【数据挖掘】数据挖掘总结 ( 贝叶斯分类器示例 ) ★ 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

文章目錄

一、貝葉斯分類器分類的流程
二、貝葉斯分類器分類示例 1

參考博客 :

【數(shù)據(jù)挖掘】貝葉斯分類 ( 貝葉斯分類器 | 貝葉斯推斷 | 逆向概率 | 貝葉斯公式 | 貝葉斯公式推導(dǎo) | 使用貝葉斯公式求逆向概率 )
【數(shù)據(jù)挖掘】貝葉斯公式應(yīng)用拼寫糾正示例分析 ( 先驗概率 | 似然概率 | 后驗概率 )
【數(shù)據(jù)挖掘】貝葉斯公式在垃圾郵件過濾中的應(yīng)用 ( 先驗概率 | 似然概率 | 后驗概率 )
【數(shù)據(jù)挖掘】樸素貝葉斯分類器 ( 多屬性概率計算 | 樸素貝葉斯分類案例分析 )
【數(shù)據(jù)挖掘】拉普拉斯修正 ( 判別模型 | 概率模型 | 貝葉斯分類 | 拉普拉斯修正 | 樸素貝葉斯分類應(yīng)用場景 | 樸素貝葉斯優(yōu)缺點 )
【數(shù)據(jù)挖掘】貝葉斯信念網(wǎng)絡(luò) ( 馬爾科夫假設(shè) | 結(jié)構(gòu) | 有向無環(huán)圖 | 參數(shù) | 條件概率表 | 案例分析 )

一、貝葉斯分類器分類的流程

已知條件 :

已知樣本 : 已知若干個樣本

未知樣本 : 給定 $1$ 個未知樣本 , 其有 $4$ 個屬性組成向量 $X\rm X$ , 樣本的分類有兩種 , $Y\rm Y$ 和 $N\rm N$ ; ( Yes / No )

分類步驟 :

計算兩個概率 , 即

① 樣本取值為 $X\rm X$ 向量時 , 分類為 $Y\rm Y$ 的概率 , 公式為 $P(Y∣X)=P(X∣Y)P(Y)P(X)\rm P(Y|X) = \cfrac{P(X | Y) P(Y)}{P(X)}$ , 其中 $P(X∣Y)P(Y)\rm P(X | Y) P(Y)$ 含義是 : 樣本分類 $Y\rm Y$ 的概率 $P(Y)\rm P(Y)$ , 乘以樣本分類為 $Y\rm Y$ 前提下樣本取值 $X\rm X$ 時的概率 $P(X∣Y)\rm P(X | Y)$ , 是 $P(XY)\rm P(XY)$ 共同發(fā)生的概率 ;

② 樣本取值為 $X\rm X$ 向量時 , 分類為 $N\rm N$ 的概率 , 公式為 $P(N∣X)=P(X∣N)P(N)P(X)\rm P(N|X) = \cfrac{P(X | N) P(N)}{P(X)}$ , 其中 $P(X∣N)P(N)\rm P(X | N) P(N)$ 含義是 : 樣本分類為 $N\rm N$ 的概率 $P(N)\rm P(N)$ , 乘以樣本取值 $N\rm N$ 時的概率 $P(X∣N)\rm P(X | N)$ , 是 $P(XN)\rm P(XN)$ 共同發(fā)生的概率 ;

上述兩個概率 , 哪個概率高 , 就將該樣本分為哪個分類 ;

先驗概率 : $P(Y)\rm P(Y)$ , $P(N)\rm P(N)$ ;

后驗概率 : $P(X∣Y)P(Y)\rm P(X | Y) P(Y)$ , $P(X∣N)P(N)\rm P(X | N) P(N)$ ;

上述兩個公式 $P(Y∣X)=P(X∣Y)P(Y)P(X)\rm P(Y|X) = \cfrac{P(X | Y) P(Y)}{P(X)}$ 和 $P(N∣X)=P(X∣N)P(N)P(X)\rm P(N|X) = \cfrac{P(X | N) P(N)}{P(X)}$ , 分母都是 $P(X)\rm P(X)$ , 只比較分子即可 , 其中先驗概率 $P(Y)\rm P(Y)$ , $P(N)\rm P(N)$ 很容易求得 , 重點是求兩個后驗概率 $P(X∣Y)P(Y)\rm P(X | Y) P(Y)$ , $P(X∣N)P(N)\rm P(X | N) P(N)$ ;

后驗概率 $P(X∣Y)\rm P(X | Y)$ 求法 : 針對 $X\rm X$ 向量中 $4$ 個分量屬性的取值 , 當(dāng)樣品類型是 $Y\rm Y$ 時 , 分量 $1$ 取值為該分量屬性時的概率 , 同理計算出 $4$ 個分量屬性對應(yīng)的 $4$ 個概率 , 最后將四個概率相乘 ;

后驗概率 $P(X∣Y)\rm P(X | Y)$ 再乘以先驗概率 $P(Y)\rm P(Y)$ , 就是最終的 未知樣本分類為 $Y\rm Y$ 類型的概率 ;

最終對比樣本 , ① 未知樣本分類為 $Y\rm Y$ 類型的概率 , ② 未知樣本分類為 $N\rm N$ 類型的概率 , 哪個概率大 , 就分類為哪個類型 ;

二、貝葉斯分類器分類示例 1

分類需求 : 根據(jù) 年齡 , 收入水平 , 是否是學(xué)生 , 信用等級 , 預(yù)測 " 年齡小于 30 歲 , 收入中等 , 學(xué)生 , 信用等級一般 " 的用戶是否會購買商品 ;

年齡收入水平是否是學(xué)生信用等級是否購買商品

小于 30 歲	高收入	不是	一般	不會 $N\rm N$
小于 30 歲	高收入	不是	很好	不會 $N\rm N$
31 ~ 39 歲	高收入	不是	一般	會 $Y\rm Y$
40 歲以上	中等收入	不是	一般	會 $Y\rm Y$
40 歲以上	低收入	是	一般	會 $Y\rm Y$
40 歲以上	低收入	是	很好	不會 $N\rm N$
31 ~ 40 歲	低收入	不是	很好	會 $Y\rm Y$
小于 30 歲	中等收入	不是	一般	不會 $N\rm N$
小于 30 歲	低收入	是	一般	會 $Y\rm Y$
40 歲以上	中等收入	是	一般	會 $Y\rm Y$
小于 30 歲	中等收入	是	很好	會 $Y\rm Y$
31 ~ 39 歲	中等收入	不是	很好	會 $Y\rm Y$
31 ~ 39 歲	高收入	是	一般	會 $Y\rm Y$
40 歲以上	中等收入	不是	很好	不會 $N\rm N$

未知樣本取值 $X\rm X$ 向量為 " 年齡小于 30 歲 , 收入中等 , 學(xué)生 , 信用等級一般 " ;

未知樣本分類為 $Y\rm Y$ 類型的概率 : $P(Y∣X)=P(X∣Y)P(Y)P(X)\rm P(Y | X) = \cfrac{P(X|Y) P(Y)}{P(X)}$

未知樣本分類為 $N\rm N$ 類型的概率 : $P(N∣X)=P(X∣N)P(N)P(X)\rm P(N | X) = \cfrac{P(X|N) P(N)}{P(X)}$

上述兩個概率的分母 $P(X)\rm P(X)$ 是常數(shù) , 對比時可以忽略 , 只需要對比分子即可 ;

先驗概率 $P(Y)=914\rm P(Y) = \cfrac{9}{14}$ , $P(N)=514\rm P(N) = \cfrac{5}{14}$ , $9$ 個人購買商品 , $5$ 個人沒有購買商品 ;

后驗概率

① $P(X∣Y)=P(年齡小于30∣Y)×P(收入中等∣Y)×P(是學(xué)生∣Y)×P(信用等級一般∣Y)=29×49×69×69\rm \begin{array}{lcl} \rm P(X|Y) &=& \rm P( 年齡小于 30 | Y) \times P( 收入中等 | Y) \times P( 是學(xué)生 | Y) \times P( 信用等級一般 | Y) \\\\ &=& \cfrac{2}{9} \times \cfrac{4}{9} \times \cfrac{6}{9} \times \cfrac{6}{9} \\ \end{array}$

② $P(X∣N)=P(年齡小于30∣N)×P(收入中等∣N)×P(是學(xué)生∣N)×P(信用等級一般∣N)=35×25×15×25\begin{array}{lcl} \rm P(X|N) &=& \rm P( 年齡小于 30 | N) \times P( 收入中等 | N) \times P( 是學(xué)生 | N) \times P( 信用等級一般 | N) \\\\ &=& \cfrac{3}{5} \times \cfrac{2}{5} \times \cfrac{1}{5} \times \cfrac{2}{5} \\\\ \end{array}$

未知樣本分類為 $Y\rm Y$ 類型的概率分子 : $\cfrac{2}{9} \times \cfrac{4}{9} \times \cfrac{6}{9} \times \cfrac{6}{9} \times \cfrac{9}{14} \approx 0.0282186948853616$

未知樣本分類為 $N\rm N$ 類型的概率分子 : $\cfrac{3}{5} \times \cfrac{2}{5} \times \cfrac{1}{5} \times \frac{2}{5} \times \cfrac{5}{14} \approx 0.0068571428571429$

該樣本分類為 $Y\rm Y$ , 會購買商品 ;

總結(jié)

以上是生活随笔為你收集整理的【数据挖掘】数据挖掘总结 ( 贝叶斯分类器示例 ) ★的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：华南理工计算机就业棒棒,为梦想、为公益，
下一篇： GPU+VORONOI+KOKKOS+O