日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

NLP-基础知识-007(机器学习-朴素贝叶斯)

發布時間:2025/4/5 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NLP-基础知识-007(机器学习-朴素贝叶斯) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

舉個例子: 郵件是否是垃圾郵件

垃圾郵件里經常出現“廣告”,“購買”,“產品”這些單詞。 也就是 p(“廣告”| 垃圾) > p(“廣告”| 正常)P(“購買”| 垃圾) > p(“購買”| 正常) …. 這些概率怎么計算?

假設: 每個郵件包含10個單詞

正常郵件24個? => 單詞: 240個? 購買出現過3次

垃圾郵件12個? => 單詞: 120個? ?購買出現7次

p("購買|正常") = 3/240

p("購買|垃圾") = 1/120

貝葉斯定理:p(x,y) = p(x|y)p(y) = p(y|x)p(x) ==> p(x|y) = p(y|x)p(x)/p(y)

條件獨立:

p(x,y|z) = p(x|z)p(y|z) x和y是條件獨立于變量z

?

來了一個新郵件"購買物品,不是廣告"p(正常|內容) >? p(垃圾|內容)= p(內容|正常)p(正常)/p(內容) >? p(內容|垃圾)p(垃圾)/p(內容)= p(內容|正常)p(正常) >? p(內容|垃圾)p(垃圾)p(正常)、p(垃圾)是先驗2/3,1/3p(內容|正常) = p(購買,物品、不是、廣告|正常) = p(購買|正常)p(物品|正常)p(不是|正常)p(廣告|正常) p(購買|正常)、p(物品|正常)、p(不是|正常)、p(廣告|正常)都是通過先驗知識計算

通過下面例子即可了解模型過程

背景:判斷新郵件是否異常數據如下:垃圾郵件:點擊 獲得 更多 信息購買 最新 產品 獲得 優惠優惠 信息 點擊 鏈接正常郵件:明天 一起 開會開會 信息 詳見 郵件最新 競品 信息新郵件:最新 產品 實惠 點擊 鏈接解決方法:v = {點擊、獲得、更多、信息、購買、最新、產品、優惠、鏈接、明天、一起、開會、詳見、郵件、競品} |v| = 15訓練模型:p(垃圾) = 1/2 p(正常)=1/2p(點擊|垃圾) = 3/28p(獲得|垃圾) = 3/28p(最新|垃圾) = 1/14p(產品|垃圾) = 1/14p(實惠|垃圾) = 3/28p(鏈接|垃圾) = 1/14p(點擊|正常) = 1/24p(獲得|正常) = 2/25p(最新|正常) = 2/25p(產品|正常) = 1/25p(實惠|正常) = 1/25p(鏈接|正常) = 1/25預測 p(垃圾|郵件) >? p(正常|郵件)p(郵件|垃圾)p(垃圾) >? p(郵件|正常)p(正常)3/28*3/28*1/14*1/14*3/28*1/14 >? 1/24*2/25*2/25*1/25*1/25*1/25underflow:采取log形式 overflow:采取平滑

?

總結

以上是生活随笔為你收集整理的NLP-基础知识-007(机器学习-朴素贝叶斯)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。