當前位置:
首頁 >
花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析
發(fā)布時間:2025/3/15
39
豆豆
生活随笔
收集整理的這篇文章主要介紹了
花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
1、導入數(shù)據(jù)
#導入花萼數(shù)據(jù) from sklearn.datasets import load_iris iris=load_iris() iris.data前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用于識別鳶尾花的屬性
2、建模
#創(chuàng)建kmeans聚類 from sklearn.cluster import KMeans kmeans=KMeans(n_clusters=3,init='k-means++',random_state=123) #分為三類 y_kmeans=kmeans.fit_predict(iris.data) y_kmeans可以看出0聚類得很好,但是2當中夾雜著1,1中夾雜著2,1和2存在混淆
3、可視化聚類模型
import matplotlib.pyplot as plt #畫出了三個類的中心點位置 plt.scatter(iris.data[y_kmeans==0,2],iris.data[y_kmeans==0,3],s=100,c='red',label='Cluter 1') plt.scatter(iris.data[y_kmeans==1,2],iris.data[y_kmeans==1,3],s=100,c='blue',label='Cluter 2') plt.scatter(iris.data[y_kmeans==2,2],iris.data[y_kmeans==2,3],s=100,c='green',label='Cluter 3')plt.scatter(kmeans.cluster_centers_[:,2],kmeans.cluster_centers_[:,3],s=100,c='black',label='Controids') plt.legend() plt.show()從圖上可以看出,第0類為花瓣長度,花瓣寬度較低的類別,第1類為花瓣長度,花瓣寬度居中的類別,圖中黑點為三個類別的中心點
4、模型優(yōu)化
對于聚類模型,分多少類是關(guān)鍵點,每類數(shù)據(jù)到其中心點的距離之和,值越小據(jù)類越好,但是當類別越多,k自然就越小,值對應(yīng)的也就越小,因此有一種判定方法當快速下降趨于平緩下降的轉(zhuǎn)折點,為聚類的最好情況。
vess=[] for i in range(1,4):kmeans=KMeans(n_clusters=i,init='k-means++',random_state=42)kmeans.fit(iris.data)vess.append(kmeans.inertia_)#kmeans.inertia_ 每類數(shù)據(jù)到其中心點的距離之和 plt.plot(range(1,4),vess) plt.show()可以發(fā)現(xiàn)到橫坐標為2時,中心點距離緩慢下降,所以分成兩類會比較好
以上簡單的聚類模型建立完畢啦,后續(xù)再優(yōu)化吧
總結(jié)
以上是生活随笔為你收集整理的花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python怎么输入一个数字并调用_py
- 下一篇: 代码实现tan graph model