【坑】Sketch算法——Count-Min Sketch和Universal Sketch
文章目錄
- 參考鏈接
- 一、Sketch算法用來(lái)做什么?
- 二、Min-count sketch
- 基礎(chǔ)思想:
- 進(jìn)階:
- 特點(diǎn):
- 三、Universal Sketch
參考鏈接
[1] Count-Min Sketch: https://blog.csdn.net/pipisorry/article/details/64126199
[2] Cormode G, Muthukrishnan S. An improved data stream summary: the count-min sketch and its applications[J]. Journal of Algorithms, 2005, 55(1): 58-75.
一、Sketch算法用來(lái)做什么?
用于計(jì)數(shù)的算法,犧牲一定的準(zhǔn)確性換來(lái)高效率,適合用在實(shí)時(shí)性要求比較高的場(chǎng)景。
二、Min-count sketch
Count-Min Sketch 由 Cormode 和 Muthukrishnan 等人于2005年提出,這是頻率估計(jì)問(wèn)題的基本解決辦法之一。
基礎(chǔ)思想:
進(jìn)階:
若數(shù)據(jù)類型很多,數(shù)組長(zhǎng)度有限,極有可能互相沖突,即不同的數(shù)據(jù)hash到數(shù)組的同一個(gè)位置上,影響計(jì)數(shù)的精度;
為了提高精度,使用多個(gè)數(shù)組和多個(gè)哈希函數(shù)。數(shù)組A對(duì)應(yīng)哈希函數(shù)A,數(shù)組B對(duì)應(yīng)哈希函數(shù)B,新到一個(gè)元素則在所有數(shù)組對(duì)應(yīng)索引的位置都加1。
要查詢某個(gè)元素出現(xiàn)的次數(shù),則返回這些數(shù)組里面對(duì)應(yīng)索引位置最小的(因此,叫min-count)。
特點(diǎn):
- 計(jì)數(shù)只會(huì)估算偏大;
- 需要固定大小的內(nèi)存和計(jì)算時(shí)間,和需要統(tǒng)計(jì)的元素多少無(wú)關(guān);
- 對(duì)于低頻的元素,估算值相對(duì)的錯(cuò)誤可能會(huì)很大。
三、Universal Sketch
總結(jié)
以上是生活随笔為你收集整理的【坑】Sketch算法——Count-Min Sketch和Universal Sketch的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: mysql 回退查询_MySQL数据库:
- 下一篇: 【待补】Wireshark+BLE do