當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

K均值算法总结

發(fā)布時間：2023/12/9 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 K均值算法总结小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

這幾天在一個項目上需要用到K均值聚類算法，以前都是直接利用百度老師copy一個Kmeans算法代碼，這次想自己利用已知的算法思想編寫一下，編寫才知道，雖然熟悉了算法思想，真正實(shí)現(xiàn)時，還是遇到不少bug，這就是小學(xué)老師說的"眼高手低"，還是需要親自動手實(shí)現(xiàn)一下，才算真正的掌握思想。

回顧一下Kmeas算法思想，將若干元素聚為k類，使之，每一類內(nèi)的元素相似度較高，類間的元素相似度較低，達(dá)到將若干元素劃分的目的，具體如下：

1.初始化質(zhì)心，初始化質(zhì)心有多種初始化方法，我熟知的有兩種，隨機(jī)選擇k個元素，作為k個初始質(zhì)心；利用最大最小原則初始化質(zhì)心。

前者簡單，不做解釋，重點(diǎn)解釋一下后者，"最大最小"

這里，兩個元素距離較近，認(rèn)為是相似的，距離較遠(yuǎn)，相似度低

1）第一個質(zhì)心是隨機(jī)選取的，這里用隨機(jī)數(shù)作為第一個質(zhì)心

2）第二個質(zhì)心的選擇：選取剩下的元素到第一個質(zhì)心的相似度的最小值，作為第二個質(zhì)心（通俗理解是找一個距離第一個質(zhì)心最遠(yuǎn)的元素）

3）第三個質(zhì)心的選擇：找一個距離第一個，第二個質(zhì)心最遠(yuǎn)的元素（剩下的元素到第一個，第二個質(zhì)心的相似度=max(sim(元素，第一個質(zhì)心)，sim(元素，第二個質(zhì)心))），然后min（max(sim(元素，第一個質(zhì)心)，sim(元素，第二個質(zhì)心))），這就是最大最小的具體體現(xiàn)。

4）剩下的質(zhì)心選擇同3）

2.在確定了K個初始質(zhì)心之后，然后對剩下的n-k個元素，劃分到距離最近的質(zhì)心中，這樣每個簇中就多于1個元素

3.更新每一個簇中的質(zhì)心

4.求每個簇的誤差，進(jìn)而求總誤差，如果滿足閾值要求，就終止算法，不滿足進(jìn)入5.

5.迭代對每個元素執(zhí)行2中的劃分，質(zhì)心不再變化，就終止算法，否則就繼續(xù)更新質(zhì)心，執(zhí)行5.

下面是算法代碼：

http://yunpan.cn/cyRsyLbzwqekE? 提取碼 edb0

轉(zhuǎn)載于:https://www.cnblogs.com/yuwenfeng/p/4210007.html

總結(jié)

以上是生活随笔為你收集整理的K均值算法总结的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： JavaScript闭包学习笔记
下一篇：【云图】如何设置支付宝里的家乐福全国连锁

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

K均值算法总结

總結(jié)