當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习实战学习笔记一 k-近邻算法

發(fā)布時間：2024/7/19 编程问答 47 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习实战学习笔记一 k-近邻算法小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

k-近鄰算法很簡單，這里就不贅述了，主要看一下python實現(xiàn)這個算法的一些細節(jié)。下面是書中給出的算法的具體實現(xiàn)。

def clssify(inX,dataset,label,k):#計算距離datasetSize = dataset.shape[0]diffMat = tile(inX,(dataSize,1))-datasetsqdiffMat = diffMat ** 2distance = sqdiffMat.sum(axis = 1)sorteddistance = distance.argsort()labelcount = {}for i in range(k):label_index = label[sorteddistance[i]]labelcount[label_index] = sortedlabel = sorted(labelcount.iteritems(),key = operator.itemgetlabelcount.get(label_index,0)+1ter(0),reverse = True) return sortedlabel[0][0]

　　我學習python沒多長時間，一句一句來學習這段代碼，發(fā)現(xiàn)收獲不小。首先來看第一句，dataset.shape[0]返回的是dataset這個array的行數(shù)。

tile這個函數(shù)非常牛逼啊，我只說它在這個里面是什么意思，我們知道inX是個向量，而dataset是個矩陣，兩者之間要進行相減的運算，需要把這個向量也補成一個和dataset有相同行數(shù)列數(shù)的矩陣，怎么個補法呢。這就要看tile()的第二個參數(shù)了，也就是上面的(datasetsize,1)，這個參數(shù)的意思就是把inX補成有datasetsize行數(shù)的矩陣。

假如inX是（1，2） datasetsize =3 那么經(jīng)過tile()轉換后產(chǎn)生了一個這樣的矩陣（[1,2],[1,2],[1,2]）

然后和dataset相減就是根據(jù)矩陣的減法進行的。接下來看sqdiffMat.sum(axis = 1)這句，假如sqdiffMat是([1,2],[0,1],[3,4])關注下axis這個參數(shù)，它影響了你對矩陣求和時候的順序，axis=0是按照行求和，axis=1是按照列進行求和，因此這樣的求和結果就是([4,7])。至于argsort()這個函數(shù)的作用很簡單，就是把向量中每個元素進行排序，而它的結果是元素的索引形成的向量。例子如下：

distance是這么個東西------([1,4,3])

經(jīng)過distance.argsort()之后的結果是([0,2,1])

另外需要主意的一點是sorted()函數(shù)返回的是一個list。

轉載于:https://www.cnblogs.com/lianwl/p/3314964.html

總結

以上是生活随笔為你收集整理的机器学习实战学习笔记一 k-近邻算法的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Solaris 11 安装图解（8）
下一篇：团结就是力量，TeamCola浅谈创业团

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

机器学习实战学习笔记 一 k-近邻算法

總結

机器学习实战学习笔记一 k-近邻算法