数据挖掘十大算法--K-均值聚类算法
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘十大算法--K-均值聚类算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、相異度計算
在正式討論聚類前,我們要先弄清楚一個問題:如何定量計算兩個可比較元素間的相異度。用通俗的話說,相異度就是兩個東西差別有多大,例如人類與章魚的相異度明顯大于人類與黑猩猩的相異度,這是能我們直觀感受到的。但是,計算機沒有這種直觀感受能力,我們必須對相異度在數學上進行定量定義。
設 ,其中X,Y是兩個元素項,各自具有n個可度量特征屬性,那么X和Y的相異度定義為:
,其中R為實數域。也就是說相異度是兩個元素對實數域的一個映射,所映射的實數定量表示兩個元素的相異度。
下面介紹不同類型變量
總結
以上是生活随笔為你收集整理的数据挖掘十大算法--K-均值聚类算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据挖掘十大算法--Apriori算法
- 下一篇: K近邻算法基础:KD树的操作