【坑】Sketch算法——Count-Min Sketch和Universal Sketch
生活随笔
收集整理的這篇文章主要介紹了
【坑】Sketch算法——Count-Min Sketch和Universal Sketch
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
文章目錄
- 參考鏈接
- 一、Sketch算法用來做什么?
- 二、Min-count sketch
- 基礎思想:
- 進階:
- 特點:
- 三、Universal Sketch
參考鏈接
[1] Count-Min Sketch: https://blog.csdn.net/pipisorry/article/details/64126199
[2] Cormode G, Muthukrishnan S. An improved data stream summary: the count-min sketch and its applications[J]. Journal of Algorithms, 2005, 55(1): 58-75.
一、Sketch算法用來做什么?
用于計數的算法,犧牲一定的準確性換來高效率,適合用在實時性要求比較高的場景。
二、Min-count sketch
Count-Min Sketch 由 Cormode 和 Muthukrishnan 等人于2005年提出,這是頻率估計問題的基本解決辦法之一。
基礎思想:
進階:
若數據類型很多,數組長度有限,極有可能互相沖突,即不同的數據hash到數組的同一個位置上,影響計數的精度;
為了提高精度,使用多個數組和多個哈希函數。數組A對應哈希函數A,數組B對應哈希函數B,新到一個元素則在所有數組對應索引的位置都加1。
要查詢某個元素出現的次數,則返回這些數組里面對應索引位置最小的(因此,叫min-count)。
特點:
- 計數只會估算偏大;
- 需要固定大小的內存和計算時間,和需要統計的元素多少無關;
- 對于低頻的元素,估算值相對的錯誤可能會很大。
三、Universal Sketch
總結
以上是生活随笔為你收集整理的【坑】Sketch算法——Count-Min Sketch和Universal Sketch的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql 回退查询_MySQL数据库:
- 下一篇: php dos,防止用户利用PHP代码D