日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

聚类--K均值算法:自主实现与sklearn.cluster.KMeans调用

發(fā)布時間:2025/7/25 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 聚类--K均值算法:自主实现与sklearn.cluster.KMeans调用 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
import numpy as np x=np.random.randint(1,100,[20,1]) #在1-100范圍中產(chǎn)生20行1列的隨機數(shù)組 y=np.zeros(20) k=3
#取數(shù)據(jù)中k個對象為初始中心,每個對象代表一個聚類中心 def initcenter(x,k):
return x[:k] kc=initcenter(x,k) kc
#對于樣本中的數(shù)據(jù)對象,根據(jù)它們與這些聚類中心的歐氏距離,按距離最近的準則將它們分到距離它們最近的聚類中心(最相似)所對應的類; def nearest(kc,i): #數(shù)組中的值,與聚類中心最小距離所在類別的索引號d
=(abs(kc-i))w=np.where(d==np.min(d))return w[0][0] def xclassify(x,y,kc): #對每個數(shù)據(jù)進行循環(huán),將分類的結果放進對應y位置中for i in range(x.shape[0]):y[i]=nearest(kc,x[i])return y
#更新聚類中心:將每個類別中所有對象所對應的均值作為該類別的聚類中心,計算目標函數(shù)的值; def kcmean(x,y,kc,k):l
=list(kc)flag=Falsefor c in range(k):print(c)m=np.where(y==c)print(m,x[m])n=np.mean(x[m])print(kc[c],n)if l[c]!=n:kc[c]=n #這個值沒賦上print(type(kc),kc[c])l[c]=nflag=True #聚類中心發(fā)生變化print(l,flag)return(np.array(l),flag) flag=True print("x值為",x,"y值為",y,"kc值為",kc,"flag值為",flag)
#判斷聚類中心和目標函數(shù)的值是否發(fā)生改變,若不變,則輸出結果,若改變,則返回2)
while flag:y = xclassify(x,y,kc)kc, flag = kcmean(x,y,kc,k)print(y,kc,type(kc)) print(x,y)
#鳶尾花花瓣長度數(shù)據(jù)做聚類并用散點圖顯示 import matplotlib.pyplot
as plt plt.scatter(x,x,c=x,s=50,cmap="rainbow"); plt.show()
#鳶尾花花瓣長度數(shù)據(jù)做聚類并用散點圖顯示。 import numpy
as np from sklearn.datasets import load_iris iris=load_iris() x=iris.data[:,1] y=np.zeros(150)def initcenter(x,k): #初始聚類中心數(shù)組return x[0:k].reshape(k)def nearest(kc,i): #數(shù)組中的值,與聚類中心最小距離所在類別的索引號d = (abs(kc-i))w = np.where(d == np.min(d))return w[0][0]def xclassify(x,y,kc):for i in range(x.shape[0]): #對數(shù)組的每個值進行分類,shape[0]讀取矩陣第一維度的長度y[i] = nearest(kc,x[i])return ydef kcmean(x,y,kc,k): #計算各聚類新均值l = list(kc)flag = Falsefor c in range(k):print(c)m = np.where(y == c)n=np.mean(x[m])if l[c] != n:l[c] = nflag = True #聚類中心發(fā)生變化print(l,flag)return (np.array(l),flag)k = 3 kc = initcenter(x,k)flag = True print(x,y,kc,flag)
#判斷聚類中心和目標函數(shù)的值是否發(fā)生改變,若不變,則輸出結果,若改變,則返回2
while flag:y = xclassify(x,y,kc)kc, flag = kcmean(x,y,kc,k)print(y,kc,type(kc))print(x,y) import matplotlib.pyplot as plt plt.scatter(x,x,c=y,s=50,cmap="Paired"); plt.show()
#用sklearn.cluster.KMeans,鳶尾花花瓣長度數(shù)據(jù)做聚類并用散點圖顯示 import matplotlib.pyplot
as plt import numpy as np from sklearn.datasets import load_irisiris = load_iris() X = iris.data Xfrom sklearn.cluster import KMeansest = KMeans(n_clusters = 3) est.fit(X) kc = est.cluster_centers_ y_kmeans = est.predict(X) #預測每個樣本的聚類索引print(y_kmeans,kc) print(kc.shape,y_kmeans.shape,np.shape)plt.scatter(X[:,0],X[:,1],c=y_kmeans,s=50,cmap='rainbow'); plt.show()

?

?

?

?

?

?

?

?

?

轉載于:https://www.cnblogs.com/h000/p/9865044.html

總結

以上是生活随笔為你收集整理的聚类--K均值算法:自主实现与sklearn.cluster.KMeans调用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內容還不錯,歡迎將生活随笔推薦給好友。