花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析
生活随笔
收集整理的這篇文章主要介紹了
花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、導入數據
#導入花萼數據 from sklearn.datasets import load_iris iris=load_iris() iris.data前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用于識別鳶尾花的屬性
2、建模
#創建kmeans聚類 from sklearn.cluster import KMeans kmeans=KMeans(n_clusters=3,init='k-means++',random_state=123) #分為三類 y_kmeans=kmeans.fit_predict(iris.data) y_kmeans可以看出0聚類得很好,但是2當中夾雜著1,1中夾雜著2,1和2存在混淆
3、可視化聚類模型
import matplotlib.pyplot as plt #畫出了三個類的中心點位置 plt.scatter(iris.data[y_kmeans==0,2],iris.data[y_kmeans==0,3],s=100,c='red',label='Cluter 1') plt.scatter(iris.data[y_kmeans==1,2],iris.data[y_kmeans==1,3],s=100,c='blue',label='Cluter 2') plt.scatter(iris.data[y_kmeans==2,2],iris.data[y_kmeans==2,3],s=100,c='green',label='Cluter 3')plt.scatter(kmeans.cluster_centers_[:,2],kmeans.cluster_centers_[:,3],s=100,c='black',label='Controids') plt.legend() plt.show()從圖上可以看出,第0類為花瓣長度,花瓣寬度較低的類別,第1類為花瓣長度,花瓣寬度居中的類別,圖中黑點為三個類別的中心點
4、模型優化
對于聚類模型,分多少類是關鍵點,每類數據到其中心點的距離之和,值越小據類越好,但是當類別越多,k自然就越小,值對應的也就越小,因此有一種判定方法當快速下降趨于平緩下降的轉折點,為聚類的最好情況。
vess=[] for i in range(1,4):kmeans=KMeans(n_clusters=i,init='k-means++',random_state=42)kmeans.fit(iris.data)vess.append(kmeans.inertia_)#kmeans.inertia_ 每類數據到其中心點的距離之和 plt.plot(range(1,4),vess) plt.show()可以發現到橫坐標為2時,中心點距離緩慢下降,所以分成兩類會比較好
以上簡單的聚類模型建立完畢啦,后續再優化吧
總結
以上是生活随笔為你收集整理的花瓣长度和花瓣宽度散点图鸢尾花_基于python的鸢尾花简单聚类模型分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python怎么输入一个数字并调用_py
- 下一篇: 代码实现tan graph model