每日一博 - 如何理解跳表(SkipList)
文章目錄
- 什么是跳躍表SkipList
- 跳表關鍵字
- Why Skip List
- Code
- 跳表-查詢
- 跳表-刪除
- 跳表-插入
- 小結
- 完整Code
什么是跳躍表SkipList
跳躍表(簡稱跳表)由美國計算機科學家William Pugh于1989年發明
論文: Skip lists: a probabilistic alternative to balanced trees
跳表(SkipList,全稱跳躍表)是用于有序元素序列快速搜索查找的一個數據結構,跳表是一個隨機化的數據結構,實質就是一種可以進行二分查找的有序鏈表。
跳表在原有的有序鏈表上面增加了多級索引,通過索引來實現快速查找。
跳表不僅能提高搜索性能,同時也可以提高插入和刪除操作的性能。它在性能上和紅黑樹,AVL樹不相上下,但是跳表的原理非常簡單,實現也比紅黑樹簡單很多。
跳表關鍵字
- 隨機化
- 有序鏈表
- 索引
- 二分查找
Why Skip List
地球人都知道的事兒:
- 順序表(數組)是內存上一塊連續的區域,基于下標,查找速度快。
- 鏈表: 內存上不連續,通過指針相連, 插入和刪除動作效率特別高,但是查詢呢,時間復雜度o(n)
那么鏈表上查詢的時間復雜度能優化一下嗎?
我們知道有很多算法有個思想: 空間換時間 。 如果在鏈表的上面加一層索引,讓部分節點在上層能夠直接定位到,這樣鏈表的查詢時間近乎減少一半 。
那查詢的時候,就會發生某些變化 -----------> 如果要查找某個節點, 首先需要從上一層快速定位到節點所在的一個范圍 ,如果向下查找的有個向下的指針指向真實的數據,那理論上,以前有n, 現在就是 n/2 .
當然了,如果節點數據量超巨,一樣很慢,可能就損耗在了,一層一層的查找上。 我們知道二分查找每次都能折半的去壓縮查找范圍, 那用上這個二分查找是不是就會快很多????
事實上,跳表就能讓鏈表擁有近乎的接近二分查找的效率的一種數據結構,其原理依然是給上面加若干層索引,優化查找速度。
通過上圖我們可以知道,這樣的一個數據結構對有序鏈表進行查找都能近乎二分的性能。
究其原因就是在上面維護了多層的索引,
首先在最高級索引上查找最后一個小于當前查找元素的位置,然后再跳到次高級索引繼續查找,直到跳到最底層為止,這時候以及十分接近要查找的元素的位置了(如果查找元素存在的話)。
由于根據索引可以一次跳過多個元素,所以跳查找的查找速度也就變快了。
對于理想的跳表,每向上一層索引節點數量都是下一層的1/2.那么如果n個節點增加的節點數量(1/2+1/4+…)<n。并且層數較低,對查找效果影響不大。
但是對于這么一個結構,你可能會疑惑,這樣完美的結構真的存在嗎?大概率不存在的,因為作為一個鏈表,少不了增刪該查的一些操作。而刪除和插入可能會改變整個結構,所以上面的這些都是理想的結構,在插入的時候是否添加上層索引是個概率問題(1/2的概率)。
Code
在實現本跳表的過程為了便于操作,我們將跳表的頭結點(head)的key設為int的最小值(一定滿足左小右大方便比較)。
對于每個節點的設置,設置成SkipNode類,為了防止初學者將next向下還是向右搞混,直接設置right,down兩個指針。
class SkipNode<T> {int key;T value;SkipNode right,down;//右下個方向的指針public SkipNode (int key,T value) {this.key=key;this.value=value;} }跳表的結構和初始化, 其主要參數和初始化方法為:
public class SkipList <T> {SkipNode headNode;//頭節點,入口int highLevel;//當前跳表索引層數Random random;// 用于投擲硬幣final int MAX_LEVEL = 32;//最大的層SkipList(){random=new Random();headNode=new SkipNode(Integer.MIN_VALUE,null);highLevel=0;}//其他方法 }跳表-查詢
很多時候鏈表也可能這樣相連僅僅是某個元素或者key作為有序的標準。所以有可能鏈表內部存在一些value。不過修改和查詢其實都是一個操作,找到關鍵數字(key)。并且查找的流程也很簡單,設置一個臨時節點team=head。當team不為null其流程大致如下:
-
(1) 從team節點出發,如果當前節點的key與查詢的key相等,那么返回當前節點(如果是修改操作那么一直向下進行修改值即可)。
-
(2) 如果key不相等,且右側為null,那么證明只能向下(結果可能出現在下右方向),此時team=team.down
-
(3) 如果key不相等,且右側不為null,且右側節點key小于待查詢的key。那么說明同級還可向右,此時team=team.right
-
(4)(否則的情況)如果key不相等,且右側不為null,且右側節點key大于待查詢的key 。那么說明如果有結果的話就在這個索引和下個索引之間,此時team=team.down。
最終將按照這個步驟返回正確的節點或者null(說明沒查到)。
例如上圖查詢12節點.
- 第一步從head出發發現右側不為空,且7<12,向右;
- 第二步右側為null向下;
- 第三步節點7的右側10<12繼續向右;
- 第四步10右側為null向下;
- 第五步右側12小于等于向右。
- 第六步起始發現相等返回節點結束。
代碼如下
public SkipNode search(int key) {SkipNode team=headNode;while (team!=null) {if(team.key==key){return team;}else if(team.right==null)//右側沒有了,只能下降{team=team.down;}else if(team.right.key>key)//需要下降去尋找{team=team.down;}else //右側比較小向右{team=team.right;}}return null; }跳表-刪除
刪除操作比起查詢稍微復雜一丟丟,但是比插入簡單。刪除需要改變鏈表結構所以需要處理好節點之間的聯系。對于刪除操作需要謹記以下幾點:
-
(1)刪除當前節點和這個節點的前后節點都有關系
-
(2)刪除當前層節點之后,下一層該key的節點也要刪除,一直刪除到最底層
根據這兩點分析一下:如果找到當前節點了,它的前面一個節點怎么查找呢?這個總不能再遍歷一遍吧!有的使用四個方向的指針(上下左右)用來找到左側節點。是可以的,但是這里可以特殊處理一下 ,不直接判斷和操作節點,先找到待刪除節點的左側節點。通過這個節點即可完成刪除,然后這個節點直接向下去找下一層待刪除的左側節點。
設置一個臨時節點team=head,當team不為null具體循環流程為:
-
(1)如果team右側為null,那么team=team.down(之所以敢直接這么判斷是因為左側有頭結點在左側,不用擔心特殊情況)
-
(2)如果team右側不 為null,并且右側的key等于待刪除的key,那么先刪除節點,再team向下team=team.down為了刪除下層節點。
-
(3)如果team右側不 為null,并且右側key小于待刪除的key,那么team向右team=team.right。
-
(4)如果team右側不 為null,并且右側key大于待刪除的key,那么team向下team=team.down,在下層繼續查找刪除節點。
例如上圖刪除10節點,
- 首先team=head從team出發,7<10向右(team=team.right后面省略);
- 第二步右側為null只能向下;
- 第三部右側為10在當前層刪除10節點然后向下繼續查找下一層10節點;
- 第四步8<10向右;
- 第五步右側為10刪除該節點并且team向下。
- team為null說明刪除完畢退出循環。
跳表-插入
插入操作在實現起來是最麻煩的,需要的考慮的東西最多。
查詢,不需要動索引;
刪除,每層索引如果有刪除就是了。
插入不一樣了,插入需要考慮是否插入索引,插入幾層等問題。
由于需要插入刪除所以我們肯定無法維護一個完全理想的索引結構,因為它耗費的代價太高。但我們使用隨機化的方法去判斷是否向上層插入索引。
即產生一個[0-1]的隨機數如果小于0.5就向上插入索引,插入完畢后再次使用隨機數判斷是否向上插入索引。運氣好這個值可能是多層索引,運氣不好只插入最底層(這是100%插入的)。但是索引也不能不限制高度,我們一般會設置索引最高值如果大于這個值就不往上繼續添加索引了。
其流程為
-
(1)首先通過上面查找的方式,找到待插入的左節點。插入的話最底層肯定是需要插入的,所以通過鏈表插入節點(需要考慮是否為末尾節點)
-
(2)插入完這一層,需要考慮上一層是否插入,首先判斷當前索引層級,如果大于最大值那么就停止(比如已經到最高索引層了)。否則設置一個隨機數1/2的概率向上插入一層索引(因為理想狀態下的就是每2個向上建一個索引節點)。
-
(3)繼續(2)的操作,直到概率退出或者索引層數大于最大索引層。
在具體向上插入的時候,實質上還有非常重要的細節需要考慮。首先如何找到上層的待插入節點 ?
這個各個實現方法可能不同,如果有左、上指向的指針那么可以向左向上找到上層需要插入的節點,但是如果只有右指向和下指向的我們也可以巧妙的借助查詢過程中記錄下降的節點。因為曾經下降的節點倒序就是需要插入的節點,最底層也不例外(因為沒有匹配值會下降為null結束循環)。在這里我使用棧這個數據結構進行存儲,當然使用List也可以。
下圖就是給了一個插入示意圖。
其次如果該層是目前的最高層索引,需要繼續向上建立索引應該怎么辦?
首先跳表最初肯定是沒索引的,然后慢慢添加節點才有一層、二層索引,但是如果這個節點添加的索引突破當前最高層,該怎么辦呢?
這時候需要注意了,跳表的head需要改變了,新建一個ListNode節點作為新的head,將它的down指向老head,將這個head節點加入棧中(也就是這個節點作為下次后面要插入的節點),就比如上面的9節點如果運氣夠好再往上建立一層節點,會是這樣的。
插入上層的時候注意所有節點要新建(拷貝),除了right的指向down的指向也不能忘記,down指向上一個節點可以用一個臨時節點作為前驅節點。如果層數突破當前最高層,頭head節點(入口)需要改變。
代碼如下
public void add(SkipNode node) {int key=node.key;SkipNode findNode=search(key);if(findNode!=null)//如果存在這個key的節點{findNode.value=node.value;return;}Stack<SkipNode>stack=new Stack<SkipNode>();//存儲向下的節點,這些節點可能在右側插入節點SkipNode team=headNode;//查找待插入的節點 找到最底層的哪個節點。while (team!=null) {//進行查找操作 if(team.right==null)//右側沒有了,只能下降{stack.add(team);//將曾經向下的節點記錄一下team=team.down;}else if(team.right.key>key)//需要下降去尋找{stack.add(team);//將曾經向下的節點記錄一下team=team.down;}else //向右{team=team.right;}}int level=1;//當前層數,從第一層添加(第一層必須添加,先添加再判斷)SkipNode downNode=null;//保持前驅節點(即down的指向,初始為null)while (!stack.isEmpty()) {//在該層插入nodeteam=stack.pop();//拋出待插入的左側節點SkipNode nodeTeam=new SkipNode(node.key, node.value);//節點需要重新創建nodeTeam.down=downNode;//處理豎方向downNode=nodeTeam;//標記新的節點下次使用if(team.right==null) {//右側為null 說明插入在末尾team.right=nodeTeam;}//水平方向處理else {//右側還有節點,插入在兩者之間nodeTeam.right=team.right;team.right=nodeTeam;}//考慮是否需要向上if(level>MAX_LEVEL)//已經到達最高級的節點啦break;double num=random.nextDouble();//[0-1]隨機數if(num>0.5)//運氣不好結束break;level++;if(level>highLevel)//比當前最大高度要高但是依然在允許范圍內 需要改變head節點{highLevel=level;//需要創建一個新的節點SkipNode highHeadNode=new SkipNode(Integer.MIN_VALUE, null);highHeadNode.down=headNode;headNode=highHeadNode;//改變headstack.add(headNode);//下次拋出head}} }小結
對于上面,跳表完整分析就結束啦,當然,你可能看到不同品種跳表的實現,還有的用數組方式表示上下層的關系這樣也可以,但本文只定義right和down兩個方向的鏈表更純正化的講解跳表。
對于跳表以及跳表的同類競爭產品:紅黑樹,為啥Redis的有序集合(zset) 使用跳表呢?因為跳表除了查找插入維護和紅黑樹有著差不多的效率,它是個鏈表,能確定范圍區間,而區間問題在樹上可能就沒那么方便查詢啦。
而JDK中跳躍表ConcurrentSkipListSet和ConcurrentSkipListMap。
完整Code
import java.util.Random; import java.util.Stack; class SkipNode<T> {int key;T value;SkipNode right,down;//左右上下四個方向的指針public SkipNode (int key,T value) {this.key=key;this.value=value;}} public class SkipList <T> {SkipNode headNode;//頭節點,入口int highLevel;//層數Random random;// 用于投擲硬幣final int MAX_LEVEL = 32;//最大的層SkipList(){random=new Random();headNode=new SkipNode(Integer.MIN_VALUE,null);highLevel=0;}public SkipNode search(int key) {SkipNode team=headNode;while (team!=null) {if(team.key==key){return team;}else if(team.right==null)//右側沒有了,只能下降{team=team.down;}else if(team.right.key>key)//需要下降去尋找{team=team.down;}else //右側比較小向右{team=team.right;}}return null;}public void delete(int key)//刪除不需要考慮層數{SkipNode team=headNode;while (team!=null) {if (team.right == null) {//右側沒有了,說明這一層找到,沒有只能下降team=team.down;}else if(team.right.key==key)//找到節點,右側即為待刪除節點{team.right=team.right.right;//刪除右側節點team=team.down;//向下繼續查找刪除}else if(team.right.key>key)//右側已經不可能了,向下{team=team.down;}else { //節點還在右側team=team.right;}}}public void add(SkipNode node){int key=node.key;SkipNode findNode=search(key);if(findNode!=null)//如果存在這個key的節點{findNode.value=node.value;return;}Stack<SkipNode>stack=new Stack<SkipNode>();//存儲向下的節點,這些節點可能在右側插入節點SkipNode team=headNode;//查找待插入的節點 找到最底層的哪個節點。while (team!=null) {//進行查找操作if(team.right==null)//右側沒有了,只能下降{stack.add(team);//將曾經向下的節點記錄一下team=team.down;}else if(team.right.key>key)//需要下降去尋找{stack.add(team);//將曾經向下的節點記錄一下team=team.down;}else //向右{team=team.right;}}int level=1;//當前層數,從第一層添加(第一層必須添加,先添加再判斷)SkipNode downNode=null;//保持前驅節點(即down的指向,初始為null)while (!stack.isEmpty()) {//在該層插入nodeteam=stack.pop();//拋出待插入的左側節點SkipNode nodeTeam=new SkipNode(node.key, node.value);//節點需要重新創建nodeTeam.down=downNode;//處理豎方向downNode=nodeTeam;//標記新的節點下次使用if(team.right==null) {//右側為null 說明插入在末尾team.right=nodeTeam;}//水平方向處理else {//右側還有節點,插入在兩者之間nodeTeam.right=team.right;team.right=nodeTeam;}//考慮是否需要向上if(level>MAX_LEVEL)//已經到達最高級的節點啦break;double num=random.nextDouble();//[0-1]隨機數if(num>0.5)//運氣不好結束break;level++;if(level>highLevel)//比當前最大高度要高但是依然在允許范圍內 需要改變head節點{highLevel=level;//需要創建一個新的節點SkipNode highHeadNode=new SkipNode(Integer.MIN_VALUE, null);highHeadNode.down=headNode;headNode=highHeadNode;//改變headstack.add(headNode);//下次拋出head}}}public void printList() {SkipNode teamNode=headNode;int index=1;SkipNode last=teamNode;while (last.down!=null){last=last.down;}while (teamNode!=null) {SkipNode enumNode=teamNode.right;SkipNode enumLast=last.right;System.out.printf("%-8s","head->");while (enumLast!=null&&enumNode!=null) {if(enumLast.key==enumNode.key){System.out.printf("%-5s",enumLast.key+"->");enumLast=enumLast.right;enumNode=enumNode.right;}else{enumLast=enumLast.right;System.out.printf("%-5s","");}}teamNode=teamNode.down;index++;System.out.println();}}public static void main(String[] args) {SkipList<Integer>list=new SkipList<Integer>();for(int i=1;i<20;i++){list.add(new SkipNode(i,666));}list.printList();list.delete(4);list.delete(8);list.printList();} }參考: https://www.toutiao.com/a6910597347328426503
總結
以上是生活随笔為你收集整理的每日一博 - 如何理解跳表(SkipList)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 每日一博 - CAS(Compare-A
- 下一篇: DDD - 如何理解Entity与VO