Redis radix tree源码解析
Redis實現(xiàn)了不定長壓縮前綴的radix tree,用在集群模式下存儲slot對應(yīng)的的所有key信息。本文將詳述在Redis中如何實現(xiàn)radix tree。
核心數(shù)據(jù)結(jié)構(gòu)
raxNode是radix tree的核心數(shù)據(jù)結(jié)構(gòu),其結(jié)構(gòu)體如下代碼所示:
typedef struct raxNode {uint32_t iskey:1; uint32_t isnull:1; uint32_t iscompr:1; uint32_t size:29; unsigned char data[]; } raxNode;-
iskey:表示這個節(jié)點是否包含key
- 0:沒有key
- 1:表示從頭部到其父節(jié)點的路徑完整的存儲了key,查找的時候按子節(jié)點iskey=1來判斷key是否存在
- isnull:是否有存儲value值,比如存儲元數(shù)據(jù)就只有key,沒有value值。value值也是存儲在data中
- iscompr:是否有前綴壓縮,決定了data存儲的數(shù)據(jù)結(jié)構(gòu)
- size:該節(jié)點存儲的字符個數(shù)
-
data:存儲子節(jié)點的信息
-
- iscompr=0:非壓縮模式下,數(shù)據(jù)格式是:[header strlen=0][abc][a-ptr][b-ptr][c-ptr](value-ptr?),有size個字符,緊跟著是size個指針,指向每個字符對應(yīng)的下一個節(jié)點。size個字符之間互相沒有路徑聯(lián)系。
- iscompr=1:壓縮模式下,數(shù)據(jù)格式是:[header strlen=3][xyz][z-ptr](value-ptr?),只有一個指針,指向下一個節(jié)點。size個字符是壓縮字符片段
Rax Insert
以下用幾個示例來詳解rax tree插入的流程。假設(shè)j是遍歷已有節(jié)點的游標(biāo),i是遍歷新增節(jié)點的游標(biāo)。
場景一:只插入abcd
z-ptr指向的葉子節(jié)點iskey=1,使用了壓縮前綴。
場景二:在abcd之后插入abcdef
從abcd父節(jié)點的每個壓縮前綴字符比較,遍歷完所有abcd節(jié)點后指向了其空子節(jié)點,j = 0, i < len(abcded)。
查找到abcd的空子節(jié)點,直接將ef賦值到子節(jié)點上,成為abcd的子節(jié)點。ef節(jié)點被標(biāo)記為iskey=1,用來標(biāo)識abcd這個key。ef節(jié)點下再創(chuàng)建一個空子節(jié)點,iskey=1來表示abcdef這個key。
場景三:在abcd之后插入ab
ab在abcd能找到前兩位的前綴,也就是i=len(ab),j < len(abcd)。
將abcd分割成ab和cd兩個子節(jié)點,cd也是一個壓縮前綴節(jié)點,cd同時被標(biāo)記為iskey=1,來表示ab這個key。
cd下掛著一個空子節(jié)點,來標(biāo)記abcd這個key。
場景四:在abcd之后插入abABC
abcABC在abcd中只找到了ab這個前綴,即i < len(abcABC),j < len(abcd)。這個步驟有點復(fù)雜,分解一下:
- step 1:將abcd從ab之后拆分,拆分成ab、c、d 三個節(jié)點。
- step 2:c節(jié)點是一個非壓縮的節(jié)點,c掛在ab子節(jié)點上。
- step 3:d節(jié)點只有一個字符,所以也是一個非壓縮節(jié)點,掛在c子節(jié)點上。
- step 4:將ABC 拆分成了A和BC, A掛在ab子節(jié)點上,和c節(jié)點屬于同一個節(jié)點,這樣A就和c同屬于父節(jié)點ab。
- step 5:將BC作為一個壓縮前綴的節(jié)點,掛在A子節(jié)點下。
- step 6:d節(jié)點和BC節(jié)點都掛一個空子節(jié)點分別標(biāo)識abcd和abcABC這兩個key。
場景五:在abcd之后插入Aabc
abcd和Aabc沒有前綴匹配,i = 0,j = 0。
將abcd拆分成a、bcd兩個節(jié)點,a節(jié)點是一個非壓縮前綴節(jié)點。
將Aabc拆分成A、abc兩個節(jié)點,A節(jié)點也是一個非壓縮前綴節(jié)點。
將A節(jié)點掛在和a相同的父節(jié)點上。
同上,在bcd和abc這兩個節(jié)點下掛空子節(jié)點來分別表示兩個key。
Rax Remove
刪除
刪除一個key的流程比較簡單,找到iskey的節(jié)點后,向上遍歷父節(jié)點刪除非iskey的節(jié)點。如果是非壓縮的父節(jié)點并且size > 1,表示還有其他非相關(guān)的路徑存在,則需要按刪除子節(jié)點的模式去處理這個父節(jié)點,主要是做memove和realloc。
合并
刪除一個key之后需要嘗試做一些合并,以收斂樹的高度。
合并的條件是:
- iskey=1的節(jié)點不能合并
- 子節(jié)點只有一個字符
- 父節(jié)點只有一個子節(jié)點(如果父節(jié)點是壓縮前綴的節(jié)點,那么只有一個子節(jié)點,滿足條件。如果父節(jié)點是非壓縮前綴的節(jié)點,那么只能有一個字符路徑才能滿足條件)
結(jié)束語
云數(shù)據(jù)庫Redis版(ApsaraDB for Redis)是一種穩(wěn)定可靠、性能卓越、可彈性伸縮的數(shù)據(jù)庫服務(wù)?;陲w天分布式系統(tǒng)和全SSD盤高性能存儲,支持主備版和集群版兩套高可用架構(gòu)。提供了全套的容災(zāi)切換、故障遷移、在線擴容、性能優(yōu)化的數(shù)據(jù)庫解決方案。歡迎各位購買使用:云數(shù)據(jù)庫 Redis 版
原文鏈接
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的Redis radix tree源码解析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于TableStore的亿级订单管理解
- 下一篇: MySQL8.0 - 新特性 - 安全及