日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据挖掘十大经典算法之——K-Means 算法

發布時間:2025/3/21 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据挖掘十大经典算法之——K-Means 算法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數據挖掘十大經典算法系列,點擊鏈接直接跳轉

  • 數據挖掘簡介及十大經典算法(大綱索引)
  • 1. 數據挖掘十大經典算法之——C4.5 算法
  • 2. 數據挖掘十大經典算法之——K-Means 算法
  • 3. 數據挖掘十大經典算法之——SVM 算法
  • 4. 數據挖掘十大經典算法之——Apriori 算法
  • 5. 數據挖掘十大經典算法之——EM 算法
  • 6. 數據挖掘十大經典算法之——PageRank 算法
  • 7 數據挖掘十大經典算法之——AdaBoost 算法
  • 8. 數據挖掘十大經典算法之——KNN 算法
  • 9. 數據挖掘十大經典算法之——Naive Bayes 算法
  • 10. 數據挖掘十大經典算法之——CART 算法

簡介

K-Means是一個簡單的聚類算法,把n 的對象根據他們的屬性分為k 個分割,k < n。算法的核心就是要優化失真函數J,使其收斂到局部最小值但不是全局最小值。
,其中N 為樣本數,K 是簇數,rnk b 表示n 屬于第k 個簇,uk 是第k 個中心點的值。然后求出最優的uk

優點:算法速度很快。

缺點是,分組的數目k 是一個輸入參數,不合適的k 可能返回較差的結果。

原理

步驟

特性

案例

代碼

python半監督K均值代碼:
代碼來源:https://blog.csdn.net/tyh70537/article/details/80483654

# -*- coding: utf-8 -*- import numpy as npdef distEclud(vecA, vecB):'''輸入:向量A和B輸出:A和B間的歐式距離'''return np.sqrt(sum(np.power(vecA - vecB, 2)))def newCent(L):'''輸入:有標簽數據集L輸出:根據L確定初始聚類中心'''centroids = []label_list = np.unique(L[:,-1])for i in label_list:L_i = L[(L[:,-1])==i]cent_i = np.mean(L_i,0)centroids.append(cent_i[:-1])return np.array(centroids) def semi_kMeans(L, U, distMeas=distEclud, initial_centriod=newCent):'''輸入:有標簽數據集L(最后一列為類別標簽)、無標簽數據集U(無類別標簽)輸出:聚類結果'''dataSet = np.vstack((L[:,:-1],U))#合并L和Ulabel_list = np.unique(L[:,-1])k = len(label_list) #L中類別個數m = np.shape(dataSet)[0]clusterAssment = np.zeros(m)#初始化樣本的分配 centroids = initial_centriod(L)#確定初始聚類中心clusterChanged = Truewhile clusterChanged:clusterChanged = Falsefor i in range(m):#將每個樣本分配給最近的聚類中心minDist = np.inf; minIndex = -1for j in range(k):distJI = distMeas(centroids[j,:],dataSet[i,:])if distJI < minDist:minDist = distJI; minIndex = jif clusterAssment[i] != minIndex: clusterChanged = TrueclusterAssment[i] = minIndexreturn clusterAssment

學術

應用

參考資料

總結

以上是生活随笔為你收集整理的数据挖掘十大经典算法之——K-Means 算法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。