K-means均值聚类算法寻找质心,Python
生活随笔
收集整理的這篇文章主要介紹了
K-means均值聚类算法寻找质心,Python
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
import numpy as np# 歐氏距離計(jì)算
def distEclud(x,y):return np.sqrt(np.sum((x-y)**2)) # 計(jì)算歐氏距離# 為給定數(shù)據(jù)集構(gòu)建一個包含K個隨機(jī)質(zhì)心的集合
def randCent(dataSet,k):m,n = dataSet.shapecentroids = np.zeros((k,n))for i in range(k):index = int(np.random.uniform(0,m)) centroids[i,:] = dataSet[index,:]return centroids# k均值聚類
def kmeans_open(dataSet,k):m = np.shape(dataSet)[0] #行的數(shù)目# 第一列存樣本屬于哪一簇# 第二列存樣本的到簇的中心點(diǎn)的誤差clusterAssment = np.mat(np.zeros((m,2)))clusterChange = True# 第1步 初始化centroidscentroids = randCent(dataSet,k)while clusterChange:clusterChange = False# 遍歷所有的樣本(行數(shù))for i in range(m):minDist = 100000.0minIndex = -1# 遍歷所有的質(zhì)心#第2步 找出最近的質(zhì)心for j in range(k):# 計(jì)算該樣本到質(zhì)心的歐式距離distance = distEclud(centroids[j,:],dataSet[i,:])if distance < minDist:minDist = distanceminIndex = j# 第 3 步:更新每一行樣本所屬的簇if clusterAssment[i,0] != minIndex:clusterChange = TrueclusterAssment[i,:] = minIndex,minDist**2#第 4 步:更新質(zhì)心for j in range(k):pointsInCluster = dataSet[np.nonzero(clusterAssment[:,0].A == j)[0]] # 獲取簇類所有的點(diǎn)centroids[j,:] = np.mean(pointsInCluster,axis=0) # 對矩陣的行求均值return clusterAssment.A[:,0], centroids
?
總結(jié)
以上是生活随笔為你收集整理的K-means均值聚类算法寻找质心,Python的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【C++】寻找数组第k大元素
- 下一篇: 抛硬币仿真实验java_探索HyperL