日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

如何理解naive Bayes

發布時間:2025/3/21 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 如何理解naive Bayes 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原理:

已知有兩個類class0,class1,已知文檔docx,現在需要判斷該文檔屬于哪一個類。

將其轉化為概率問題

即求P(class0|docx)和P(class1|docx)這兩個值,然后比大小

由bayes公式,P(class0|docx)P(docx) = P(docx|class0)*P(class0)。同理class1

P(class0|docx):docx屬于class0的概率

P(docx):產生出docx的概率

P(class0):表示class0的先驗概率,例如分類體育類,財經類,任意拿了1萬個語料,體育類8000個,財經類2000個,那么體育類先驗的就是80%。

P(docx|class0):表示class0生成出docx的概率

由于比大小P(docx)是完全一致的,因此略去

則計算的是P(docx|class0)*P(class0),其中P(class0)可以從語料中觀測到。

現在就歸結到計算P(docx|class0)

在詞袋模型的假設下,docx可以由獨立同分布的詞向量構成,即docx={term1,term2,term3...termn}。

即P(docx|class0) = P( {x1,x2,x3,..xn} |class0),其中x1表示term1出現的次數,第一維表示term1

由獨立假設

?P( {x1,x2,x3,..xn} |class0)=P({x1,0,0,...0}|class0)*P({0,x2,0,0,...}|class0)

?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? =(y1^x1)*(y2^x2)... ? ?y1表示term1在class0的概率。即class0的全部文檔看作是1個文檔,計算term1的出現概率。

兩邊取對數

?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?=x1log(y1)+x2log(y2)....

如果對整個P(docx|class0)*P(class0)取對數,在求負數,相當用用f(x) = -log(x)作用一下x,則有

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? -log(P(docx|class0)*P(class0)) = -log(P(class0)) + - x1log(y1)+ -x2log(y2).... ?其中x1表示在docx中term1出現的次數

至此我們可以將公式看作一個docx對class0提供的信息量的累加,在什么信息都沒有的情況下,是class0的信息量是 -log(P(class0),在term1出現了x1次以后,信息量增加了-x1log(y1),依次往復,相當于docx用class0這個model能壓縮的最小物理空間XXbit。也就是說,借助class0的分布,只用XXbit就可以表示docx。從壓縮上想不難理解,class0提供了一個特征的概率分布特點,用香濃公式來對每個特征按照概率編碼。

?? ? ? ? ? ?

?舉個計算過程的例子

1)訓練語料如下

?? ? ? ?term1 ? term2 ?term3 ?term4 ? class

doc1 ? ?0 ? ? ? 1 ? ? ? ? ? 1 ? ? ? ? ? 1 ? ? ? ? 1 ??
doc2 ? ?1 ? ? ? 1 ? ? ? ? ? 0 ? ? ? ? ? 0 ? ? ? ? 0?
doc3 ? ?2 ? ? ? 3 ? ? ? ? ? 1 ? ? ? ? ? 0 ? ? ? ? 0 ? ?
doc4 ? ?2 ? ? ? 2 ? ? ? ? ? 0 ? ? ? ? ? 1 ? ? ? ? 0 ??
doc5 ? ?1 ? ? ? 0 ? ? ? ? ? 2 ? ? ? ? ? 3 ? ? ? ? 1
2)計算model parameter

w0(1) = log(2/5) ? w0(0) = log(3/5) ? ? ?[在5個樣本中,label 1有2個,lable 0有3個]

w1(1) = log(1/9) ? w1(0) = log(5/13) ? ?[term1 在label為0的標簽的3個樣本中,出現了5次,label為0的標簽的3個樣本中共計各種term出現了13次]

w2(1) = log(1/9) ? w2(0) = log(6/13) ? ?

w3(1) = log(3/9) ? w3(0) = log(1/13)

w4(1) = log(4/9) ? w4(0) = log(1/13)


3)given test sample

docx (1,3,2,0,1) ?{1表示我是一個文檔,3表示term1出現了3次,2表示term2出現了2次...}

4)計算屬于哪個類

p(1|docx) = -(1*log(2/5)+3*log(1/9)+2*log(1/9)+0*log(3/9)+1*log(4/9)) = ?6.4755775834193

p(0|docx) = -(1*log(3/5)+3*log(5/13)+2*log(6/13)+0*log(1/13)+1*log(1/13) )= ?3.6672696976529

so docx is class 0,用class0的分布表示docx,只需要3.66比特,docx和class0更具有分布上的一致性。


5)理解

w0(0),w1(0)表示docx一個term都不含的時候,直接用類上的比例來推測可能得分類。比如某個docx為空文檔。

wi(0)的物理含義 ?tf向量,表示class0生成termi的能力。
wi(1)的物理含義 ?tf向量,表示class1生成termi的能力。
w(0)可以看作是一個指向label為0的samples的向量。
w(1)可以看做是一個指向label為1的samples的向量。
docx*w(0) > docx*w(1) 表示docx的類為0
docx*w(1) > docx*w(0) 表示docx的類是1

docx*w(0) = docx*w(0) 表示docx恰好距離類0和類1相同。也可理解為夾角相同,如果同除以docx和w的模就可以理解為夾角。

6)最后訓練出的model是什么?

就是訓練語料每個term出現多少次,而總次數可以將這些數字加和得到,不需存儲。

因此

class 0的model就是

?? ?term1 5

?? ?term2 6

?? ?term3 1

?? ?term4 1

在加上每個class的數目。

完畢,就是一個數數過程。


from:?http://blog.csdn.net/pennyliang/article/details/6651897

總結

以上是生活随笔為你收集整理的如何理解naive Bayes的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 1024毛片基地| videos另类灌满极品另类 | 国产女人水真多18毛片18精品 | 双性懵懂美人被强制调教 | 日剧再来一次第十集 | 欧美久久精品一级黑人c片 1000部多毛熟女毛茸茸 | 97人人干 | 天天干天天操天天爽 | 51av视频| 美女脱得一干二净 | 亚洲啪啪网站 | 五月丁香 | 天天摸天天操天天射 | 被黑人啪到哭的番号922在线 | 亚洲色图第三页 | 成人性生交视频免费观看 | 五月婷在线 | 国产成人久久精品77777综合 | 中国女人内谢69xxxx免费视频 | 亚洲12p | 中文字幕第一区 | 久久久久婷 | 国产精品影片 | 久久黄色一级 | 日本视频免费 | 日本一区二区不卡视频 | 欧美成人一区二区视频 | 日韩电影在线一区 | 99自拍偷拍 | 一区二区啪啪啪 | 加勒比在线一区 | 成人午夜淫片免费观看 | 天堂av资源 | 久久精品免费在线观看 | 91丨九色丨黑人外教 | 性一交一乱一伧老太 | 国产美女自拍视频 | 天天操天天插天天射 | 国产一区二区三区在线免费 | 久久久久久久久久久久 | 久久久国产精品黄毛片 | 免费在线观看中文字幕 | 国产精品久久久久久久专区 | 男人都懂的网站 | 青娱乐自拍视频 | 蜜桃导航-精品导航 | 欧美国产三级 | 乱老熟女一区二区三区 | 性歌舞团一区二区三区视频 | 美日韩成人 | 国产中文字幕二区 | 日韩特级片 | 成人一级片 | 小草av在线 | 亚洲播放 | 成人免费xxxxx在线观看 | 偷拍视频一区二区 | 国产精品日韩精品欧美精品 | xxsm.com| 亚洲av综合色区无码一区 | 欧美成人小视频 | 日韩女同互慰一区二区 | 91视频麻豆 | 日韩欧美成人一区二区三区 | 国产日韩欧美一区 | 亚洲区国产区 | 成人免费视频国产免费网站 | 欧美亚洲一级片 | 欧洲亚洲国产精品 | 久久成人av | 欧美少妇b | www.国产色 | 亚洲欧洲一区 | 亚洲国产网站 | 亚欧精品在线观看 | 久草视频免费在线观看 | 黄色成年人视频 | 91精品国产色综合久久不卡粉嫩 | 久久久久麻豆v国产精华液好用吗 | 欧美浓毛大泬视频 | 亚色视频 | 天天色天天看 | 99香蕉视频 | 色播久久 | 亚洲毛片在线观看 | 成人免费毛片日本片视频 | 国产伦精品一区二区三区四区 | 一区二区福利视频 | 日韩第一页在线 | 国产精品xxxxxx | 北条麻妃99精品青青久久 | 亚洲成人免费av | 成人黄色a级片 | 欧美激情精品久久久久久变态 | 疯狂做受xxxx国产 | 天天干天天草 | 美女黄免费| 一级肉体全黄裸片 | 涩涩视频在线观看免费 |