日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

谱聚类算法(Spectral Clustering)优化与扩展

發布時間:2025/4/16 编程问答 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 谱聚类算法(Spectral Clustering)优化与扩展 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

譜聚類算法(Spectral Clustering)優化與擴展

????譜聚類(Spectral Clustering, SC)在前面的博文中已經詳述,是一種基于圖論的聚類方法,簡單形象且理論基礎充分,在社交網絡中廣泛應用。本文將講述進一步擴展其應用場景:首先是User-Item協同聚類,即spectral coclustering,之后再詳述譜聚類的進一步優化。

1 Spectral Coclustering

1.1 協同聚類(Coclustering)

??? 在數據分析中,聚類是最常見的一種方法,對于一般的聚類算法(kmeans, spectral clustering, gmm等等),聚類結果都類似圖1所示,能挖掘出數據之間的類簇規律。

圖1 聚類結果圖

??? 即使對于常見的數據User-Item評分矩陣(常見于各社交平臺的數據之中,例如音樂網站的用戶-歌曲評分矩陣,新聞網站的用戶-新聞評分矩陣,電影網站的用戶-電影評分矩陣等等),如表1所示。在聚類分析中,也常常將數據計算成User-User的相似度關系或Item-Item的相似度關系,計算方法諸如應用Jaccard距離,將User或Item分別當成Item或User的特征,再在此基礎上計算歐氏距離、cos距離等等。

?

表1 User-Item評分矩陣

??? 但是如果能聚類成如圖2中的coclustering關系,將User和Item同時聚類,將使得數據結果更具意義,即在音樂網站中的用戶和歌曲coclustering結果表明,某些用戶大都喜歡某類歌曲,同時這類歌曲也大都只被這群用戶喜歡著。這樣,不管是用于何種場景(例如歌曲推薦),都將帶來極大的益處。

圖2 coclustering圖

1.2 Spectral Coclustering

??? 對于User-Item評分矩陣,這是一個典型的二部圖(Bipartite Grap),Item-User矩陣A,假設A為N*M,即N個item和M個user,可展開成:

其中E為(M+N)*(M+N)的方陣,且對稱。

??? 對于A的二部圖,只存在Item與User之間的鄰接邊,在Item(User)之間不存在鄰接邊。再用譜聚類原理——將帶權無向圖劃分為兩個或兩個以上的最優子圖,使子圖內部盡量相似,而子圖間距離盡量距離較遠。這樣的聚類結果將Cut盡量少的邊,分割出User和Item的類,如果類記Ci(U,I)為第i個由特定的User和Item組成的類,由譜聚類原理,Cut掉的Ci邊為中的User或Item與其它類Cj(j≠i)的邊,且其滿足某種最優Cut方法,簡單地說,Cut掉的User到其它類Cj(j≠i)的Item的邊,可理解為這些User與其它Item相似關系較小;同樣Cut掉的Item到其它類Cj(j≠i)的User的邊,可理解為這些Item與其它User相似關系較小。這正好滿足coclusering的定義。

?

??? 在譜聚類的基礎上,再實現Spectral Coclustering,十分簡單, 將E直接當成譜聚類的鄰接矩陣即可,至于求Laplacian矩陣、求特征值、計算Kmeans,完成與譜聚類相同。

??? PS:更多詳情,請參見參考文獻1。

?

2 譜聚類的半監督學習

??? 假設有大量新聞需要聚類,但對于其中的部分新聞,編輯已經人工分類好了,例如(Ni1,Ni2, …, Nim),為分類好的第i類,那么對于人工分類好的數據,就相當于聚類中的先驗知識(或正則)。

??? 在聚類時,可相應在鄰接矩陣E中增加類彼此間鄰接邊,并使得其鄰接權重較大,這樣生成的鄰接矩陣為E’。這樣,再對此鄰接矩陣E’做譜聚類,聚類結果將在一定程度上維持人工分類的結果,并達到聚類的目的。

??? PS:更多詳情,請參見參考文獻2,不過譜聚類的半監督學習,都有點扯。?

?

參考文獻:

1 Inderjit S. Dhillon. Co-clustering documents and words using Bipartite Spectral Graph Partitioning;

2 W Chen. Spectral clustering: A semi-supervised approach;

3 Wen-Yen Chen, Yangqiu Song, Hongjie Bai, Chih-Jen Lin, Edward Y. Chang. Parallel Spectral Clustering in Distributed Systems.

----

《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀

總結

以上是生活随笔為你收集整理的谱聚类算法(Spectral Clustering)优化与扩展的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。