推荐算法-聚类-层次聚类法
層次聚類算法實(shí)際上分為兩類:自上而下或自下而上。自下而上的算法在一開始就將每個(gè)數(shù)據(jù)點(diǎn)視為一個(gè)單一的聚類,然后依次合并(或聚集)類、直到所有類合并成一個(gè)包含所有數(shù)據(jù)點(diǎn)的單一聚類。因此,自下而上的層次聚類稱為合成HAC。聚類的層次結(jié)構(gòu)用一顆樹(或樹狀圖)表示。樹的根是收集所有樣本的唯一聚類,而葉子是只有一個(gè)樣本的聚類。
1.首先將每個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)單獨(dú)的聚類進(jìn)行處理。如果我們的數(shù)據(jù)集有X個(gè)數(shù)據(jù)點(diǎn),那么我們就有了X個(gè)聚類。然后我們選擇一個(gè)度量兩個(gè)聚類之間距離的距離量。作為一個(gè)示例,我們將使用平均連接(average?linkage)聚類,它定義了兩個(gè)聚類之間的距離,即第一個(gè)聚類中數(shù)據(jù)點(diǎn)和第二個(gè)聚類中數(shù)據(jù)點(diǎn)之間的平均距離。
他的工作方式都很好,而對于其他聚類算法,距離度量的選擇是至關(guān)重要的。層次聚類方法的一個(gè)特別好的用例是,當(dāng)?shù)讓訑?shù)據(jù)具有層次結(jié)構(gòu)時(shí),你可以回復(fù)層次結(jié)構(gòu)。而其他的聚類算法無法做到這一點(diǎn)。層次聚類的優(yōu)點(diǎn)是以低效率為代價(jià)的,因?yàn)樗哂蠴(n^3)的時(shí)間復(fù)雜度,與K-Means的線性復(fù)雜度不同。
?
?
總結(jié)
以上是生活随笔為你收集整理的推荐算法-聚类-层次聚类法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐算法-聚类-DBSCAN
- 下一篇: 神经网络与机器学习 笔记—复制器(恒等)