日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

推荐算法-聚类-均值偏移聚类(爬山算法)

發布時間:2025/6/17 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐算法-聚类-均值偏移聚类(爬山算法) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

? ? 均值偏移(Mean?shift)聚類算法是一種基于滑動窗口(sliding-window)的算法,它視圖找到密集的數據點。而且,它還是一種基于中心的算法,他的目標是定位每一組群/類的中心點,通過更新中心點的候選點來實現滑動窗口中點的平均值。這些候選窗口在后期處理階段被過濾,以消除幾乎重復的部分,形成最后一組中心點及其對應的組。

?

?

  • 為了解釋這一變化,我們將考慮二維空間中的一組點。我們從一個點C(隨機選擇)為中心的圓形滑窗開始,以半徑r為內核。均值偏移是一種爬山算法,他需要在內個步驟中反復地將這個內核移動到一個更高的密度區域,直到收斂。
  • 在每一次迭代中,滑動窗口會移向密度較高的區域,將中心點移動到窗口內的點的平均值(因此得名)。滑動窗口中的密度與它內部的點的數量成比例。自然地,通過移向窗口中的點的平均值,它將逐漸向更高的點密度方向移動。
  • 我們繼續根據均值移動滑動窗口,知道沒有方向移動可以容納內核中的更多點。看看上面的圖表;我們一直在移動這個圓,知道我們不在增加密度(也就是窗口中的點數)。
  • 步驟1到3的過程是用許多滑動窗口完成的,知道所有的點都位于一個窗口內。當多個滑動窗口重疊的時候,包含最多的點的窗口會被保留。然后,數據點根據它們所在的滑動窗口聚類。
  • 下面展示了從端到端所有滑動窗口的這個過程演示。每個黑點代表一個滑動窗口的質心,每個灰色點都是一個數據點。

    ?

    ?

    ? ? 與K-Means聚類相比,均值偏移不需要選擇聚類的數量,因為它會自動地發現這一點。這是一個巨大的優勢。聚類中心收斂于最大密度的事實也是非常可取的,因為它非常直觀地理解并適合于一種自然數據驅動。缺點是選擇窗口大小/半徑r是非常關鍵的,所以不能疏忽。

    ?

    總結

    以上是生活随笔為你收集整理的推荐算法-聚类-均值偏移聚类(爬山算法)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。