机器学习-分类算法-K-近邻算法06
生活随笔
收集整理的這篇文章主要介紹了
机器学习-分类算法-K-近邻算法06
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
K最近鄰(k-Nearest Neighbor,KNN)分類算法,是一個理論上比較成熟的方法,也是最簡單的機(jī)器學(xué)習(xí)算法之一。該方法的思路是:在特征空間中,如果一個樣本附近的k個最近(即特征空間中最鄰近)樣本的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別。
我們對應(yīng)上面的流程來說
1.給定了紅色和藍(lán)色的訓(xùn)練樣本,綠色為測試樣本
2.計算綠色點到其他點的距離
3.選取離綠點最近的k個點
4.選取k個點中,同種顏色最多的類。例如:k=1時,k個點全是藍(lán)色,那預(yù)測結(jié)果就是Class 1;k=3時,k個點中兩個紅色一個藍(lán)色,那預(yù)測結(jié)果就是Class 2
相似的樣本,特征之間的值都是相近的。K-近鄰算法需要做標(biāo)準(zhǔn)化處理。
數(shù)據(jù)來源:https://www.kaggle.com/c/facebook-v-predicting-check-ins/data?select=train.csv.zip
需調(diào)優(yōu)提高準(zhǔn)確度
總結(jié)
以上是生活随笔為你收集整理的机器学习-分类算法-K-近邻算法06的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习-转换器与估计器05
- 下一篇: 机器学习-分类算法-朴素贝叶斯算法07