K - 近邻算法
K - 近鄰算法(KNN),他的工作原理:存在一個樣本數據集合,也稱為訓練樣本集,并且樣本集合中每個數據都存在標簽,即我們知道樣本集合中每一個數據與所屬分類的對于關系。輸入沒有標簽的新數據后,將新數據的每個特征與樣本集中數據對應的特征值比較,然后算法提取樣本集中 特征最相似數據(最近鄰(的分類標簽,一般來說,我們只選擇樣本數據集中前K個最相似的數據 ,這就是K - 近鄰算法中k的出處。一般說來,我們可以K的值大概在20的整數。最后,選擇k個最相似數據中出現次數最多的分類,作為新數據的分類。
簡單的說,K - 近鄰算法算法就是采用測量不同特征值之間的距離方法進行分類,可以采用歐式距離或者余弦距離。
優點:精度高、對異常值不敏感、無數據輸入假定
缺點:計算復雜度高、空間負責高。
轉載于:https://www.cnblogs.com/fartherfuture/p/3628837.html
總結
- 上一篇: 祛疤多少钱啊?
- 下一篇: iOS常用动画 类封装