LRU实现
LRU全稱是Least?Recently Used,即最近最久未使用的意思。
LRU算法的設計原則是:如果一個數(shù)據(jù)在最近一段時間沒有被訪問到,那么在將來它被訪問的可能性也很小。也就是說,當限定的空間已存滿數(shù)據(jù)時,應當把最久沒有被訪問到的數(shù)據(jù)淘汰。
實現(xiàn)LRU
?????
1.用一個數(shù)組來存儲數(shù)據(jù),給每一個數(shù)據(jù)項標記一個訪問時間戳,每次插入新數(shù)據(jù)項的時候,先把數(shù)組中存在的數(shù)據(jù)項的時間戳自增,并將新數(shù)據(jù)項的時間戳置為0并插入到數(shù)組中。每次訪問數(shù)組中的數(shù)據(jù)項的時候,將被訪問的數(shù)據(jù)項的時間戳置為0。當數(shù)組空間已滿時,將時間戳最大的數(shù)據(jù)項淘汰。
2.利用一個鏈表來實現(xiàn),每次新插入數(shù)據(jù)的時候將新數(shù)據(jù)插到鏈表的頭部;每次緩存命中(即數(shù)據(jù)被訪問),則將數(shù)據(jù)移到鏈表頭部;那么當鏈表滿的時候,就將鏈表尾部的數(shù)據(jù)丟棄。
3.利用鏈表和hashmap。當需要插入新的數(shù)據(jù)項的時候,如果新數(shù)據(jù)項在鏈表中存在(一般稱為命中),則把該節(jié)點移到鏈表頭部,如果不存在,則新建一個節(jié)點,放到鏈表頭部,若緩存滿了,則把鏈表最后一個節(jié)點刪除即可。在訪問數(shù)據(jù)的時候,如果數(shù)據(jù)項在鏈表中存在,則把該節(jié)點移到鏈表頭部,否則返回-1。這樣一來在鏈表尾部的節(jié)點就是最近最久未訪問的數(shù)據(jù)項。
對于第一種方法,需要不停地維護數(shù)據(jù)項的訪問時間戳,另外,在插入數(shù)據(jù)、刪除數(shù)據(jù)以及訪問數(shù)據(jù)時,時間復雜度都是O(n)。對于第二種方法,鏈表在定位數(shù)據(jù)的時候時間復雜度為O(n)。所以在一般使用第三種方式來是實現(xiàn)LRU算法。
實現(xiàn)方案
使用LinkedHashMap實現(xiàn)
?????LinkedHashMap底層就是用的HashMap加雙鏈表實現(xiàn)的,而且本身已經實現(xiàn)了按照訪問順序的存儲。此外,LinkedHashMap中本身就實現(xiàn)了一個方法removeEldestEntry用于判斷是否需要移除最不常讀取的數(shù),方法默認是直接返回false,不會移除元素,所以需要重寫該方法。即當緩存滿后就移除最不常用的數(shù)。
????
public class LRU<K,V> {
?
? private static final float hashLoadFactory = 0.75f;
? private LinkedHashMap<K,V> map;
? private int cacheSize;
?
? public LRU(int cacheSize) {
? ? this.cacheSize = cacheSize;
? ? int capacity = (int)Math.ceil(cacheSize / hashLoadFactory) + 1;
? ? map = new LinkedHashMap<K,V>(capacity, hashLoadFactory, true){
? ? ? private static final long serialVersionUID = 1;
?
? ? ? @Override
? ? ? protected boolean removeEldestEntry(Map.Entry eldest) {
? ? ? ? return size() > LRU.this.cacheSize;
? ? ? }
? ? };
? }
?
? public synchronized V get(K key) {
? ? return map.get(key);
? }
?
? public synchronized void put(K key, V value) {
? ? map.put(key, value);
? }
?
? public synchronized void clear() {
? ? map.clear();
? }
?
? public synchronized int usedSize() {
? ? return map.size();
? }
?
? public void print() {
? ? for (Map.Entry<K, V> entry : map.entrySet()) {
? ? ? System.out.print(entry.getValue() + "--");
? ? }
? ? System.out.println();
? }
}
當存在熱點數(shù)據(jù)時,LRU的效率很好,但偶發(fā)性的、周期性的批量操作會導致LRU命中率急劇下降,緩存污染情況比較嚴重。
擴展
1.LRU-K
LRU-K中的K代表最近使用的次數(shù),因此LRU可以認為是LRU-1。LRU-K的主要目的是為了解決LRU算法“緩存污染”的問題,其核心思想是將“最近使用過1次”的判斷標準擴展為“最近使用過K次”。
相比LRU,LRU-K需要多維護一個隊列,用于記錄所有緩存數(shù)據(jù)被訪問的歷史。只有當數(shù)據(jù)的訪問次數(shù)達到K次的時候,才將數(shù)據(jù)放入緩存。當需要淘汰數(shù)據(jù)時,LRU-K會淘汰第K次訪問時間距當前時間最大的數(shù)據(jù)。
數(shù)據(jù)第一次被訪問時,加入到歷史訪問列表,如果書籍在訪問歷史列表中沒有達到K次訪問,則按照一定的規(guī)則(FIFO,LRU)淘汰;當訪問歷史隊列中的數(shù)據(jù)訪問次數(shù)達到K次后,將數(shù)據(jù)索引從歷史隊列中刪除,將數(shù)據(jù)移到緩存隊列中,并緩存數(shù)據(jù),緩存隊列重新按照時間排序;緩存數(shù)據(jù)隊列中被再次訪問后,重新排序,需要淘汰數(shù)據(jù)時,淘汰緩存隊列中排在末尾的數(shù)據(jù),即“淘汰倒數(shù)K次訪問離現(xiàn)在最久的數(shù)據(jù)”。
LRU-K具有LRU的優(yōu)點,同時還能避免LRU的缺點,實際應用中LRU-2是綜合最優(yōu)的選擇。由于LRU-K還需要記錄那些被訪問過、但還沒有放入緩存的對象,因此內存消耗會比LRU要多。
2.two queue
Two?queues(以下使用2Q代替)算法類似于LRU-2,不同點在于2Q將LRU-2算法中的訪問歷史隊列(注意這不是緩存數(shù)據(jù)的)改為一個FIFO緩存隊列,即:2Q算法有兩個緩存隊列,一個是FIFO隊列,一個是LRU隊列。當數(shù)據(jù)第一次訪問時,2Q算法將數(shù)據(jù)緩存在FIFO隊列里面,當數(shù)據(jù)第二次被訪問時,則將數(shù)據(jù)從FIFO隊列移到LRU隊列里面,兩個隊列各自按照自己的方法淘汰數(shù)據(jù)。
新訪問的數(shù)據(jù)插入到FIFO隊列中,如果數(shù)據(jù)在FIFO隊列中一直沒有被再次訪問,則最終按照FIFO規(guī)則淘汰;如果數(shù)據(jù)在FIFO隊列中再次被訪問到,則將數(shù)據(jù)移到LRU隊列頭部,如果數(shù)據(jù)在LRU隊列中再次被訪問,則將數(shù)據(jù)移動LRU隊列頭部,LRU隊列淘汰末尾的數(shù)據(jù)。
3.Multi Queue(MQ)
?????MQ算法根據(jù)訪問頻率將數(shù)據(jù)劃分為多個隊列,不同的隊列具有不同的訪問優(yōu)先級,其核心思想是:優(yōu)先緩存訪問次數(shù)多的數(shù)據(jù)。詳細的算法結構圖如下,Q0,Q1....Qk代表不同的優(yōu)先級隊列,Q-history代表從緩存中淘汰數(shù)據(jù),但記錄了數(shù)據(jù)的索引和引用次數(shù)的隊列:
新插入的數(shù)據(jù)放入Q0,每個隊列按照LRU進行管理,當數(shù)據(jù)的訪問次數(shù)達到一定次數(shù),需要提升優(yōu)先級時,將數(shù)據(jù)從當前隊列中刪除,加入到高一級隊列的頭部;為了防止高優(yōu)先級數(shù)據(jù)永遠不會被淘汰,當數(shù)據(jù)在指定的時間里沒有被訪問時,需要降低優(yōu)先級,將數(shù)據(jù)從當前隊列刪除,加入到低一級的隊列頭部;需要淘汰數(shù)據(jù)時,從最低一級隊列開始按照LRU淘汰,每個隊列淘汰數(shù)據(jù)時,將數(shù)據(jù)從緩存中刪除,將數(shù)據(jù)索引加入Q-history頭部。如果數(shù)據(jù)在Q-history中被重新訪問,則重新計算其優(yōu)先級,移到目標隊列頭部。Q-history按照LRU淘汰數(shù)據(jù)的索引。
MQ需要維護多個隊列,且需要維護每個數(shù)據(jù)的訪問時間,復雜度比LRU高。
LRU算法對比
對比點
對比
命中率
LRU-2?>?MQ(2)?>?2Q?>?LRU
復雜度
LRU-2?>?MQ(2)?>?2Q?>?LRU
代價
LRU-2??>?MQ(2)?>?2Q?>?LRU
?
超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生總結
- 上一篇: 浅谈缓存
- 下一篇: 无埋点实现监测的真相——革新还是噱头?