机器学习算法与Python实践之(六)二分k均值聚类
生活随笔
收集整理的這篇文章主要介紹了
机器学习算法与Python实践之(六)二分k均值聚类
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
機器學習算法與Python實踐這個系列主要是參考《機器學習實戰》這本書。因為自己想學習Python,然后也想對一些機器學習算法加深下了解,所以就想通過Python來實現幾個比較常用的機器學習算法。恰好遇見這本同樣定位的書籍,所以就參考這本書的過程來學習了。
在上一個博文中,我們聊到了k-means算法。但k-means算法有個比較大的缺點就是對初始k個質心點的選取比較敏感。有人提出了一個二分k均值(bisecting k-means)算法,它的出現就是為了一定情況下解決這個問題的。也就是說它對初始的k個質心的選擇不太敏感。那下面我們就來了解和實現下這個算法。
一、二分k均值(bisecting k-means)算法
二分k均值(bisecting k-means)算法的主要思想是:首先將所有點作為一個簇,然后將該簇一分為二。之后選擇能最大程度降低聚類代價函數(也就是誤差平方和)的簇劃分為兩個簇。以此進行下去,直到簇的數目等于用戶給定的數目k為止。
總結
以上是生活随笔為你收集整理的机器学习算法与Python实践之(六)二分k均值聚类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习算法与Python实践之(五)k
- 下一篇: 实例讲解hadoop中的map/redu