海量数据处理之Bloom Filter详解
生活随笔
收集整理的這篇文章主要介紹了
海量数据处理之Bloom Filter详解
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
本博客內曾已經整理過十道海量數據處理面試題與十個方法大總結。接下來,本博客內會重點分析那些海量數據處理的方法,并重寫十道海量數據處理的面試題。如果有任何問題,歡迎不吝指正。謝謝。
一、什么是Bloom Filter
Bloom Filter是一種空間效率很高的隨機數據結構,它的原理是,當一個元素被加入集合時,通過K個Hash函數將這個元素映射成一個位陣列(Bit array)中的K個點,把它們置為1。檢索時,我們只要看看這些點是不是都是1就(大約)知道集合中有沒有它了:如果這些點有任何一個0,則被檢索元素一定不在;如果都是1,則被檢索元素很可能在。這就是布隆過濾器的基本思想。
但Bloom Filter的這種高效是有一定代價的:在判斷一個元素是否屬于某個集合時,有可能會把不屬于這個集合的元素誤認為屬于這個集合(false positi
總結
以上是生活随笔為你收集整理的海量数据处理之Bloom Filter详解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Excel的使用
- 下一篇: Top K算法问题的实现