文献记录(part1)--NP-hardness of Euclidean sum-of-squares clustering
沒認真看的文獻記錄
文章目錄
- 摘要
- 簡介
- 解決問題
摘要
歐幾里得平方和聚類的NP-硬度的最新證明,由于德里尼亞斯等人(馬赫。學習。56:9–33,2004),無效。故提供了一個備選的簡短證明。
簡介
聚類是自動分析數據的強大工具。它解決了以下一般問題:給定一組實體,找到同質和/或分離良好的子集或集群。文獻中使用了許多不同的標準來表示待發現聚類的同質性和/或分離性(參見漢森和賈馬爾1997年的調查)。一個關鍵標準是從每個實體到其所屬聚類質心的平方歐幾里德距離的最小和,這表示同質性和分離性。請注意,由于惠更斯定理,這相當于所有集群內實體對之間的所有平方距離之和除以其基數。以此為目標劃分成k個聚類被稱為最小平方和聚類(MSSC)。這個問題是由經典的k-means啟發式(MacQueen 1967)和許多其他算法解決的。
在沒有正確參考文獻的情況下,文獻中常把k ≥ 2的廣義MSSC問題稱為NP-hard問題。特別是,如第2節所示,德里尼亞斯等人(2004年)的證據是無效的。由于第二和第四作者(德什潘德和波帕特,2008)的原因,第三節給出了另一個簡短的證明。請注意,另一個較長的證明是由達斯古普塔(2008)獨立獲得的,幾乎同時獲得。此外,卡納德等人(2008年)最近獨立獲得了一個與我們基本相同的證明。
解決問題
經典的k-means問題已經被證明是np.
總結
以上是生活随笔為你收集整理的文献记录(part1)--NP-hardness of Euclidean sum-of-squares clustering的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 文献学习(part23)--双向聚类方法
- 下一篇: 文献记录(part2)--A Dykst