日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

推荐算法-聚类-层次聚类法

發(fā)布時(shí)間:2025/6/17 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐算法-聚类-层次聚类法 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

層次聚類算法實(shí)際上分為兩類:自上而下或自下而上。自下而上的算法在一開始就將每個(gè)數(shù)據(jù)點(diǎn)視為一個(gè)單一的聚類,然后依次合并(或聚集)類、直到所有類合并成一個(gè)包含所有數(shù)據(jù)點(diǎn)的單一聚類。因此,自下而上的層次聚類稱為合成HAC。聚類的層次結(jié)構(gòu)用一顆樹(或樹狀圖)表示。樹的根是收集所有樣本的唯一聚類,而葉子是只有一個(gè)樣本的聚類。


1.首先將每個(gè)數(shù)據(jù)點(diǎn)作為一個(gè)單獨(dú)的聚類進(jìn)行處理。如果我們的數(shù)據(jù)集有X個(gè)數(shù)據(jù)點(diǎn),那么我們就有了X個(gè)聚類。然后我們選擇一個(gè)度量兩個(gè)聚類之間距離的距離量。作為一個(gè)示例,我們將使用平均連接(average?linkage)聚類,它定義了兩個(gè)聚類之間的距離,即第一個(gè)聚類中數(shù)據(jù)點(diǎn)和第二個(gè)聚類中數(shù)據(jù)點(diǎn)之間的平均距離。

  • 在每次迭代中,將兩個(gè)聚類合并為一個(gè)。將兩個(gè)聚類合并為具有最小平均連接的組。比如說根據(jù)我們選擇的距離度量,這兩個(gè)聚類之間的距離最小,因此是相似的,應(yīng)該組合在一起。
  • 重復(fù)步驟2知道我們達(dá)到樹的根。我們只有一個(gè)包含所有數(shù)據(jù)點(diǎn)的聚類。通過這種方式,我們可以選擇最終需要多少個(gè)聚類,只需選擇何時(shí)停止合并聚類,也就是我們停止建造這棵樹的時(shí)候!
  • 層次聚類算法不要求我們制定聚類的數(shù)量,我們甚至可以選擇哪個(gè)聚類看起來最好。此外,該算法對距離度量的選擇不敏感。
  • 他的工作方式都很好,而對于其他聚類算法,距離度量的選擇是至關(guān)重要的。層次聚類方法的一個(gè)特別好的用例是,當(dāng)?shù)讓訑?shù)據(jù)具有層次結(jié)構(gòu)時(shí),你可以回復(fù)層次結(jié)構(gòu)。而其他的聚類算法無法做到這一點(diǎn)。層次聚類的優(yōu)點(diǎn)是以低效率為代價(jià)的,因?yàn)樗哂蠴(n^3)的時(shí)間復(fù)雜度,與K-Means的線性復(fù)雜度不同。

    ?

    ?

    總結(jié)

    以上是生活随笔為你收集整理的推荐算法-聚类-层次聚类法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。