分级聚类方法
文章目錄
- 1. 算法思想
- 2. 具體步驟
- 3. 兩個類之間的相似性度量
- 4. 缺點
1. 算法思想
分級聚類方法(hierachical clustering)。聚類的結果可能是NNN類也可能是111類。
因此,在歸類的過程中可以從NNN類到111類逐級地進行類別劃分,求得一系列類別數從多到少的一個分類方案,然后根據一定的指標選擇中間某個適當的劃分方案作為聚類的結果。
2. 具體步驟
聚類的結果稱為系統樹圖(dendrogram),圖中最底層的每個節點都是一個樣本,樹枝的長度表達了類與類之間的距離關系。
3. 兩個類之間的相似性度量
Δ(τi,τj)=min?y∈τi,y^∈taujδ(y,y^)\Delta(\tau_i, \tau_j)=\min_{\boldsymbol{y} \in \tau_i, \hat{\boldsymbol{y}}\in tau_j}\delta(\boldsymbol{y}, \boldsymbol{\hat{y}}) Δ(τi?,τj?)=y∈τi?,y^?∈tauj?min?δ(y,y^?)
Δ(τi,τj)=max?y∈τi,y^∈τjδ(y,y^)\Delta(\tau_i, \tau_j)=\max_{\boldsymbol{y} \in \tau_i, \hat{\boldsymbol{y}}\in \tau_j}\delta(\boldsymbol{y}, \boldsymbol{\hat{y}}) Δ(τi?,τj?)=y∈τi?,y^?∈τj?max?δ(y,y^?)
Δ(τi,τj)=δ(mi,mj)\Delta(\tau_i, \tau_j)=\delta(\boldsymbol{m_i}, \boldsymbol{m_j}) Δ(τi?,τj?)=δ(mi?,mj?)
其中,mi\boldsymbol{m_i}mi?表示第iii類的均值。
4. 缺點
總結
- 上一篇: 山东科技大学计算机试题答案,山东科技大学
- 下一篇: OSChina 周一乱弹 —— 中年少女