日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Rocchio算法

發布時間:2023/12/19 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Rocchio算法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
其基本思想是使用訓練集為每個類構造一個原型向量,構造方法如下:給定一個類,訓練集中所有屬于這個類的文檔對應向量的分量用正數表示,所有不屬于這個類的文檔對應向量的分量用負數表示,然后把所有的向量加起來,得到的和向量就是這個類的原型向量,定義兩個向量的相似度為這兩個向量夾角的余弦,逐一計算訓練集中所有文檔和原型向量的相似度,然后按一定的算法從中挑選某個相似度作為界。給定一篇文檔,如果這篇文檔與原型向量的相似度比界大,則這篇文檔屬于這個類,否則這篇文檔就不屬于這個類。Rocchio算法的突出優點是容易實現,計算(訓練和分類)特別簡單,它通常用來實現衡量分類系統性能的基準系統,而實用的分類系統很少采用這種算法解決具體的分類問題。

其基本思想不難解釋,對于一個詞集,和一個分類,總有某些詞,這些詞一旦出現屬于這個分類的可能性就會增加,而另一些詞一旦出現屬于這個分類的可能性就會降低,那么累計這些正面的,和負面的影響因素,最后由文檔分離出的詞向量可以得到對于每個類的一個打分,打分越高屬于該類的可能性就越大.

對于某種二分類特別合適, A, ~A, 任給一個文檔,判斷屬于分類A還是分類~A,可以認為A的特征項均給與正值,~A都給與負值,那么給定一個合理閾值,就很容易做出這種類型的分類.

總結

以上是生活随笔為你收集整理的Rocchio算法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。