LRU实现
LRU全稱(chēng)是Least?Recently Used,即最近最久未使用的意思。
LRU算法的設(shè)計(jì)原則是:如果一個(gè)數(shù)據(jù)在最近一段時(shí)間沒(méi)有被訪問(wèn)到,那么在將來(lái)它被訪問(wèn)的可能性也很小。也就是說(shuō),當(dāng)限定的空間已存滿數(shù)據(jù)時(shí),應(yīng)當(dāng)把最久沒(méi)有被訪問(wèn)到的數(shù)據(jù)淘汰。
實(shí)現(xiàn)LRU
?????
1.用一個(gè)數(shù)組來(lái)存儲(chǔ)數(shù)據(jù),給每一個(gè)數(shù)據(jù)項(xiàng)標(biāo)記一個(gè)訪問(wèn)時(shí)間戳,每次插入新數(shù)據(jù)項(xiàng)的時(shí)候,先把數(shù)組中存在的數(shù)據(jù)項(xiàng)的時(shí)間戳自增,并將新數(shù)據(jù)項(xiàng)的時(shí)間戳置為0并插入到數(shù)組中。每次訪問(wèn)數(shù)組中的數(shù)據(jù)項(xiàng)的時(shí)候,將被訪問(wèn)的數(shù)據(jù)項(xiàng)的時(shí)間戳置為0。當(dāng)數(shù)組空間已滿時(shí),將時(shí)間戳最大的數(shù)據(jù)項(xiàng)淘汰。
2.利用一個(gè)鏈表來(lái)實(shí)現(xiàn),每次新插入數(shù)據(jù)的時(shí)候?qū)⑿聰?shù)據(jù)插到鏈表的頭部;每次緩存命中(即數(shù)據(jù)被訪問(wèn)),則將數(shù)據(jù)移到鏈表頭部;那么當(dāng)鏈表滿的時(shí)候,就將鏈表尾部的數(shù)據(jù)丟棄。
3.利用鏈表和hashmap。當(dāng)需要插入新的數(shù)據(jù)項(xiàng)的時(shí)候,如果新數(shù)據(jù)項(xiàng)在鏈表中存在(一般稱(chēng)為命中),則把該節(jié)點(diǎn)移到鏈表頭部,如果不存在,則新建一個(gè)節(jié)點(diǎn),放到鏈表頭部,若緩存滿了,則把鏈表最后一個(gè)節(jié)點(diǎn)刪除即可。在訪問(wèn)數(shù)據(jù)的時(shí)候,如果數(shù)據(jù)項(xiàng)在鏈表中存在,則把該節(jié)點(diǎn)移到鏈表頭部,否則返回-1。這樣一來(lái)在鏈表尾部的節(jié)點(diǎn)就是最近最久未訪問(wèn)的數(shù)據(jù)項(xiàng)。
對(duì)于第一種方法,需要不停地維護(hù)數(shù)據(jù)項(xiàng)的訪問(wèn)時(shí)間戳,另外,在插入數(shù)據(jù)、刪除數(shù)據(jù)以及訪問(wèn)數(shù)據(jù)時(shí),時(shí)間復(fù)雜度都是O(n)。對(duì)于第二種方法,鏈表在定位數(shù)據(jù)的時(shí)候時(shí)間復(fù)雜度為O(n)。所以在一般使用第三種方式來(lái)是實(shí)現(xiàn)LRU算法。
實(shí)現(xiàn)方案
使用LinkedHashMap實(shí)現(xiàn)
?????LinkedHashMap底層就是用的HashMap加雙鏈表實(shí)現(xiàn)的,而且本身已經(jīng)實(shí)現(xiàn)了按照訪問(wèn)順序的存儲(chǔ)。此外,LinkedHashMap中本身就實(shí)現(xiàn)了一個(gè)方法removeEldestEntry用于判斷是否需要移除最不常讀取的數(shù),方法默認(rèn)是直接返回false,不會(huì)移除元素,所以需要重寫(xiě)該方法。即當(dāng)緩存滿后就移除最不常用的數(shù)。
????
public class LRU<K,V> {
?
? private static final float hashLoadFactory = 0.75f;
? private LinkedHashMap<K,V> map;
? private int cacheSize;
?
? public LRU(int cacheSize) {
? ? this.cacheSize = cacheSize;
? ? int capacity = (int)Math.ceil(cacheSize / hashLoadFactory) + 1;
? ? map = new LinkedHashMap<K,V>(capacity, hashLoadFactory, true){
? ? ? private static final long serialVersionUID = 1;
?
? ? ? @Override
? ? ? protected boolean removeEldestEntry(Map.Entry eldest) {
? ? ? ? return size() > LRU.this.cacheSize;
? ? ? }
? ? };
? }
?
? public synchronized V get(K key) {
? ? return map.get(key);
? }
?
? public synchronized void put(K key, V value) {
? ? map.put(key, value);
? }
?
? public synchronized void clear() {
? ? map.clear();
? }
?
? public synchronized int usedSize() {
? ? return map.size();
? }
?
? public void print() {
? ? for (Map.Entry<K, V> entry : map.entrySet()) {
? ? ? System.out.print(entry.getValue() + "--");
? ? }
? ? System.out.println();
? }
}
當(dāng)存在熱點(diǎn)數(shù)據(jù)時(shí),LRU的效率很好,但偶發(fā)性的、周期性的批量操作會(huì)導(dǎo)致LRU命中率急劇下降,緩存污染情況比較嚴(yán)重。
擴(kuò)展
1.LRU-K
LRU-K中的K代表最近使用的次數(shù),因此LRU可以認(rèn)為是LRU-1。LRU-K的主要目的是為了解決LRU算法“緩存污染”的問(wèn)題,其核心思想是將“最近使用過(guò)1次”的判斷標(biāo)準(zhǔn)擴(kuò)展為“最近使用過(guò)K次”。
相比LRU,LRU-K需要多維護(hù)一個(gè)隊(duì)列,用于記錄所有緩存數(shù)據(jù)被訪問(wèn)的歷史。只有當(dāng)數(shù)據(jù)的訪問(wèn)次數(shù)達(dá)到K次的時(shí)候,才將數(shù)據(jù)放入緩存。當(dāng)需要淘汰數(shù)據(jù)時(shí),LRU-K會(huì)淘汰第K次訪問(wèn)時(shí)間距當(dāng)前時(shí)間最大的數(shù)據(jù)。
數(shù)據(jù)第一次被訪問(wèn)時(shí),加入到歷史訪問(wèn)列表,如果書(shū)籍在訪問(wèn)歷史列表中沒(méi)有達(dá)到K次訪問(wèn),則按照一定的規(guī)則(FIFO,LRU)淘汰;當(dāng)訪問(wèn)歷史隊(duì)列中的數(shù)據(jù)訪問(wèn)次數(shù)達(dá)到K次后,將數(shù)據(jù)索引從歷史隊(duì)列中刪除,將數(shù)據(jù)移到緩存隊(duì)列中,并緩存數(shù)據(jù),緩存隊(duì)列重新按照時(shí)間排序;緩存數(shù)據(jù)隊(duì)列中被再次訪問(wèn)后,重新排序,需要淘汰數(shù)據(jù)時(shí),淘汰緩存隊(duì)列中排在末尾的數(shù)據(jù),即“淘汰倒數(shù)K次訪問(wèn)離現(xiàn)在最久的數(shù)據(jù)”。
LRU-K具有LRU的優(yōu)點(diǎn),同時(shí)還能避免LRU的缺點(diǎn),實(shí)際應(yīng)用中LRU-2是綜合最優(yōu)的選擇。由于LRU-K還需要記錄那些被訪問(wèn)過(guò)、但還沒(méi)有放入緩存的對(duì)象,因此內(nèi)存消耗會(huì)比LRU要多。
2.two queue
Two?queues(以下使用2Q代替)算法類(lèi)似于LRU-2,不同點(diǎn)在于2Q將LRU-2算法中的訪問(wèn)歷史隊(duì)列(注意這不是緩存數(shù)據(jù)的)改為一個(gè)FIFO緩存隊(duì)列,即:2Q算法有兩個(gè)緩存隊(duì)列,一個(gè)是FIFO隊(duì)列,一個(gè)是LRU隊(duì)列。當(dāng)數(shù)據(jù)第一次訪問(wèn)時(shí),2Q算法將數(shù)據(jù)緩存在FIFO隊(duì)列里面,當(dāng)數(shù)據(jù)第二次被訪問(wèn)時(shí),則將數(shù)據(jù)從FIFO隊(duì)列移到LRU隊(duì)列里面,兩個(gè)隊(duì)列各自按照自己的方法淘汰數(shù)據(jù)。
新訪問(wèn)的數(shù)據(jù)插入到FIFO隊(duì)列中,如果數(shù)據(jù)在FIFO隊(duì)列中一直沒(méi)有被再次訪問(wèn),則最終按照FIFO規(guī)則淘汰;如果數(shù)據(jù)在FIFO隊(duì)列中再次被訪問(wèn)到,則將數(shù)據(jù)移到LRU隊(duì)列頭部,如果數(shù)據(jù)在LRU隊(duì)列中再次被訪問(wèn),則將數(shù)據(jù)移動(dòng)LRU隊(duì)列頭部,LRU隊(duì)列淘汰末尾的數(shù)據(jù)。
3.Multi Queue(MQ)
?????MQ算法根據(jù)訪問(wèn)頻率將數(shù)據(jù)劃分為多個(gè)隊(duì)列,不同的隊(duì)列具有不同的訪問(wèn)優(yōu)先級(jí),其核心思想是:優(yōu)先緩存訪問(wèn)次數(shù)多的數(shù)據(jù)。詳細(xì)的算法結(jié)構(gòu)圖如下,Q0,Q1....Qk代表不同的優(yōu)先級(jí)隊(duì)列,Q-history代表從緩存中淘汰數(shù)據(jù),但記錄了數(shù)據(jù)的索引和引用次數(shù)的隊(duì)列:
新插入的數(shù)據(jù)放入Q0,每個(gè)隊(duì)列按照LRU進(jìn)行管理,當(dāng)數(shù)據(jù)的訪問(wèn)次數(shù)達(dá)到一定次數(shù),需要提升優(yōu)先級(jí)時(shí),將數(shù)據(jù)從當(dāng)前隊(duì)列中刪除,加入到高一級(jí)隊(duì)列的頭部;為了防止高優(yōu)先級(jí)數(shù)據(jù)永遠(yuǎn)不會(huì)被淘汰,當(dāng)數(shù)據(jù)在指定的時(shí)間里沒(méi)有被訪問(wèn)時(shí),需要降低優(yōu)先級(jí),將數(shù)據(jù)從當(dāng)前隊(duì)列刪除,加入到低一級(jí)的隊(duì)列頭部;需要淘汰數(shù)據(jù)時(shí),從最低一級(jí)隊(duì)列開(kāi)始按照LRU淘汰,每個(gè)隊(duì)列淘汰數(shù)據(jù)時(shí),將數(shù)據(jù)從緩存中刪除,將數(shù)據(jù)索引加入Q-history頭部。如果數(shù)據(jù)在Q-history中被重新訪問(wèn),則重新計(jì)算其優(yōu)先級(jí),移到目標(biāo)隊(duì)列頭部。Q-history按照LRU淘汰數(shù)據(jù)的索引。
MQ需要維護(hù)多個(gè)隊(duì)列,且需要維護(hù)每個(gè)數(shù)據(jù)的訪問(wèn)時(shí)間,復(fù)雜度比LRU高。
LRU算法對(duì)比
對(duì)比點(diǎn)
對(duì)比
命中率
LRU-2?>?MQ(2)?>?2Q?>?LRU
復(fù)雜度
LRU-2?>?MQ(2)?>?2Q?>?LRU
代價(jià)
LRU-2??>?MQ(2)?>?2Q?>?LRU
?
超強(qiáng)干貨來(lái)襲 云風(fēng)專(zhuān)訪:近40年碼齡,通宵達(dá)旦的技術(shù)人生總結(jié)
- 上一篇: 浅谈缓存
- 下一篇: 无埋点实现监测的真相——革新还是噱头?