日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

拼多多的真实面试题:数亿的用户,如何用Redis统计独立用户访问量

發布時間:2024/2/28 数据库 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 拼多多的真实面试题:数亿的用户,如何用Redis统计独立用户访问量 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

眾所周至,拼多多的待遇也是高的可怕,在挖人方面也是不遺余力,對于一些工作3年的開發,稍微優秀一點的,都給到30K的Offer,當然,拼多多加班也是出名的,一周上6天班是常態,每天工作時間基本都是超過12個小時,也是相當辛苦的。廢話不多說,今天我們來聊一聊拼多多的一道后臺面試真題,是一道簡單的架構類的題目:拼多多有數億的用戶,那么對于某個網頁,怎么使用Redis來統計一個網站的用戶訪問數呢?

?

# 使用Hash

?

哈希是Redis的一種基礎數據結構,Redis底層維護的是一個開散列,會把不同的key映射到哈希表上,如果是遇到關鍵字沖突,那么就會拉出一個鏈表出來。

當一個用戶訪問的時候,如果用戶登陸過,那么我們就使用用戶的id,如果用戶沒有登陸過,那么我們也能夠前端頁面隨機生成一個key用來標識用戶,當用戶訪問的時候,我們可以使用HSET命令,key可以選擇URI與對應的日期進行拼湊,field可以使用用戶的id或者隨機標識,value可以簡單設置為1。

當我們要統計某一個網站某一天的訪問量的時候,就可以直接使用HLEN來得到最終的結果了。

優點:簡單,容易實現,查詢也是非常方便,數據準確性非常高。

缺點:占用內存過大,。隨著key的增多,性能也會下降。小網站還行,拼多多這種數億PV的網站肯定受不了

# 使用Bitset

?

我們知道,對于一個32位的int,如果我們只用來記錄id,那么只能夠記錄一個用戶,但如果我們轉成2進制,每位用來表示一個用戶,那么我們就能夠一口氣表示32個用戶,空間節省了32倍!對于有大量數據的場景,如果我們使用bitset,那么,可以節省非常多的內存。對于沒有登陸的用戶,我們也可以使用哈希算法,把對應的用戶標識哈希成一個數字id。bitset非常的節省內存,假設有1億個用戶,也只需要100000000/8/1024/1024約等于12兆內存。

Redis已經為我們提供了SETBIT的方法,使用起來非常的方便,我們可以看看下面的例子,我們在item頁面可以不停地使用SETBIT命令,設置用戶已經訪問了該頁面,也可以使用GETBIT的方法查詢某個用戶是否訪問。最后我們通過BITCOUNT可以統計該網頁每天的訪問數量。

優點:占用內存更小,查詢方便,可以指定查詢某個用戶,數據可能略有瑕疵,對于非登陸的用戶,可能不同的key映射到同一個id,否則需要維護一個非登陸用戶的映射,有額外的開銷。

?

缺點:如果用戶非常的稀疏,那么占用的內存可能比方法一更大。

?

# 使用概率算法

?

對于拼多多這種多個頁面都可能非常多訪問量的網站,如果所需要的數量不用那么準確,可以使用概率算法,事實上,我們對一個網站的UV的統計,1億跟1億零30萬其實是差不多的。在Redis中,已經封裝了HyperLogLog算法,他是一種基數評估算法。這種算法的特征,一般都是數據不存具體的值,而是存用來計算概率的一些相關數據。

當用戶訪問網站的時候,我們可以使用PFADD命令,設置對應的命令,最后我們只要通過PFCOUNT就能順利計算出最終的結果,因為這個只是一個概率算法,所以可能存在0.81%的誤差。

優點:占用內存極小,對于一個key,只需要12kb。對于拼多多這種超多用戶的特別適用。

缺點:查詢指定用戶的時候,可能會出錯,畢竟存的不是具體的數據。總數也存在一定的誤差。

上面就是常見的3種適用Redis統計網站用戶訪問數的方法了。

?

轉自:

作者:沙茶敏碎碎念?

來源:https://url.cn/5tQPEQg

總結

以上是生活随笔為你收集整理的拼多多的真实面试题:数亿的用户,如何用Redis统计独立用户访问量的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。