海量数据处理利器之Hash——在线邮件地址过滤
生活随笔
收集整理的這篇文章主要介紹了
海量数据处理利器之Hash——在线邮件地址过滤
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、需求
現在我們需要設計一個在線過濾垃圾郵件地址的方案,我們的數據庫里面已經有10億個合法的郵件地址(稱為合法地址集S),當有新的郵件發過來時,要檢查這個郵件地址是不是在我們的數據庫里面,如果在,我們接收郵件,如果不在,我們就把它當做垃圾郵件過濾掉。
總結
以上是生活随笔為你收集整理的海量数据处理利器之Hash——在线邮件地址过滤的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据挖掘之KNN分类
- 下一篇: 数据挖掘系列(1)关联规则挖掘基本概念与