日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

谱聚类算法原理及实现

發布時間:2023/12/29 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 谱聚类算法原理及实现 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
譜聚類(Spectral Clustering, SC)是一種基于圖論的聚類方法。

將帶權無向圖劃分為兩個或兩個以上的最優子圖,使子圖內部盡量相似,而子圖間距離盡量距離較遠,以達到常見的聚類的目的。

"帶權無向圖"這個詞太學術了,我們換一種叫法,即:相似度矩陣。

假設我們有一個相似度矩陣,矩陣中存的是所有對象的兩兩相似度。

?

那么這個矩陣應該有如下性質:

  • 矩陣為N * N,N為對象總數
  • 矩陣對角線的值為0,自己和自己相似個毛啊
  • 矩陣為對稱矩陣,及相似度是無向的
  • 我們將該矩陣記為:W。

    ?

    譜聚類的任務就是根據這個相似度矩陣,將這一大堆對象,分成不同的小堆,小堆內部的對象彼此都很像,小堆之間則不像。

    ?

    譜聚類本身也提供了好幾種不同的分割(cut)方法,每種方法對應一種優化目標。

    本文只介紹其中比較常見,也是比較實用,而且實現起來也比較經濟的一種:Nomarlized cut.

    ?

    說白了,就是你最應該掌握和使用的一種,好了,進入正題。

    ?

    當你得到一個相似度矩陣W后,即可通過以下幾個步驟,來得到對應的圖分割方案:

    1. 計算對角矩陣D[N*N]。,公式如下:

    ?D矩陣為對角矩陣,對角線上的值為W矩陣中對應行或列的和。

    ?

    2. 計算拉普拉斯矩陣(Laplacian) L:

    3. ?歸一化L矩陣

    4. 計算歸一化后L矩陣的K個最小特征值及對應的特征向量

    ? ? 將K個特征向量豎著并排放在一起,形成一個N*K的特征矩陣,記為Q。

    ?

    5. 對特征矩陣Q做kmeans聚類,得到一個N維向量C。

    ? ? 分別對應相似度矩陣W中每一行所代表的對象的所屬類別,這也就是最終的聚類結果。

    ?

    此外:

    關于第3步中,對拉普拉斯矩陣歸一化時,歸一化公式進行變換得到:

    ??? 令:

    ?

    則在第4步中,我們可以將求L的K個最小特征值及其對應的特征向量的問題,轉化為求矩陣E的K個最大的特征值及其對應的特征向量。

    ? ? ? ? ---可以證明:L的K個最小特征值對應的特征向量,分別對應于E的K個最大的特征值對應的特征向量。

    ? ? ? ? ? ? 且矩陣L的最小特征值為0,對應于矩陣E最大的特征值為1.矩陣L的第K小特征值等于1-矩陣E的第K大特征值

    ?

    之所以要這么做,是因為在數值計算中,求矩陣的最大特征值,往往要比求最小特征值更方便和高效。

    ?

    OK,至此,譜聚類就完成了,關于譜聚類的其他問題,諸如公式的推導,以及譜聚類的物理意義等,可參考博文:譜聚類算法。

    譜聚類的實現很簡單,按照上述5個步驟按部就班即可,在matlab中只需寥寥數行:

    ?

    function C = SpectralClustering(W, k)[n,m] = size(W) s = sum(W);D = full(sparse(1:n, 1:n, s));E = D^(-1/2)*W*D^(-1/2);[Q, V] = eigs(L, k);C = kmeans(Q, k); end


    譜聚類的完整C代碼實現,可參考:https://code.csdn.net/u011531384/ml/tree/master/psc.c

    ?

    總結

    以上是生活随笔為你收集整理的谱聚类算法原理及实现的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。