日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

分级聚类方法

發(fā)布時(shí)間:2024/3/24 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 分级聚类方法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章目錄

  • 1. 算法思想
  • 2. 具體步驟
  • 3. 兩個(gè)類(lèi)之間的相似性度量
  • 4. 缺點(diǎn)

1. 算法思想

分級(jí)聚類(lèi)方法(hierachical clustering)。聚類(lèi)的結(jié)果可能是NNN類(lèi)也可能是111類(lèi)。

因此,在歸類(lèi)的過(guò)程中可以從NNN類(lèi)到111類(lèi)逐級(jí)地進(jìn)行類(lèi)別劃分,求得一系列類(lèi)別數(shù)從多到少的一個(gè)分類(lèi)方案,然后根據(jù)一定的指標(biāo)選擇中間某個(gè)適當(dāng)?shù)膭澐址桨缸鳛榫垲?lèi)的結(jié)果。

2. 具體步驟

  • 初始化,每個(gè)樣本自成一個(gè)類(lèi)
  • 合并:通過(guò)兩個(gè)類(lèi)之間的相似性度量,按照一定標(biāo)準(zhǔn)將兩個(gè)類(lèi)合并為一類(lèi),記錄下這兩個(gè)類(lèi)之間的距離,其余類(lèi)保持不變。
  • 重復(fù)2,直到所有樣本合并到一個(gè)類(lèi)中。
  • 聚類(lèi)的結(jié)果稱(chēng)為系統(tǒng)樹(shù)圖(dendrogram),圖中最底層的每個(gè)節(jié)點(diǎn)都是一個(gè)樣本,樹(shù)枝的長(zhǎng)度表達(dá)了類(lèi)與類(lèi)之間的距離關(guān)系。

    3. 兩個(gè)類(lèi)之間的相似性度量

  • 最近距離(single linkage)
    Δ(τi,τj)=min?y∈τi,y^∈taujδ(y,y^)\Delta(\tau_i, \tau_j)=\min_{\boldsymbol{y} \in \tau_i, \hat{\boldsymbol{y}}\in tau_j}\delta(\boldsymbol{y}, \boldsymbol{\hat{y}}) Δ(τi?,τj?)=yτi?,y^?tauj?min?δ(y,y^?)
  • 最遠(yuǎn)距離(complete linkage)
    Δ(τi,τj)=max?y∈τi,y^∈τjδ(y,y^)\Delta(\tau_i, \tau_j)=\max_{\boldsymbol{y} \in \tau_i, \hat{\boldsymbol{y}}\in \tau_j}\delta(\boldsymbol{y}, \boldsymbol{\hat{y}}) Δ(τi?,τj?)=yτi?,y^?τj?max?δ(y,y^?)
  • 均值距離(average linkage)
    Δ(τi,τj)=δ(mi,mj)\Delta(\tau_i, \tau_j)=\delta(\boldsymbol{m_i}, \boldsymbol{m_j}) Δ(τi?,τj?)=δ(mi?,mj?)
    其中,mi\boldsymbol{m_i}mi?表示第iii類(lèi)的均值。
  • 4. 缺點(diǎn)

  • 分級(jí)聚類(lèi)是一種局部搜索方法,有些情況下對(duì)樣本的噪聲比較敏感,個(gè)別樣本的變動(dòng)可能導(dǎo)致聚類(lèi)結(jié)果發(fā)生很大變化。
  • 聚類(lèi)樹(shù)的畫(huà)法不唯一。
  • 總結(jié)

    以上是生活随笔為你收集整理的分级聚类方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。