分类(二):基于向量空间模型的文本分类
生活随笔
收集整理的這篇文章主要介紹了
分类(二):基于向量空间模型的文本分类
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
2019獨角獸企業(yè)重金招聘Python工程師標準>>>
????利用向量空間模型進行文本分類的思路主要基于鄰近假設(contiguity hypothesis)。
鄰近假設:
????同一類的文檔會構成一個鄰近區(qū)域,而不同類的鄰近區(qū)域之間是互不重疊的。
1、Rocchio方法
????Rocchio方法時基于質心或原型將整個向量空間劃分成多個區(qū)域,每個質心或原型代表一類,利用質心來定義劃分邊界。
2、KNN,k近鄰,k nearest neighbor
????KNN通過局部信息來確定類別邊界,將與測試文檔最近的k篇文檔所屬的主類賦給該文檔。
轉載于:https://my.oschina.net/u/1020238/blog/520192
總結
以上是生活随笔為你收集整理的分类(二):基于向量空间模型的文本分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [Bugku][Web][CTF] 9-
- 下一篇: 用for循环打印出大写字母的ASCII码