當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

mysql缓存淘汰机制_聊聊缓存淘汰算法-LRU 实现原理

發(fā)布時間：2023/12/10 数据库 45 豆豆

生活随笔收集整理的這篇文章主要介紹了 mysql缓存淘汰机制_聊聊缓存淘汰算法-LRU 实现原理小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

前言

我們常用緩存提升數(shù)據(jù)查詢速度，由于緩存容量有限，當(dāng)緩存容量到達(dá)上限，就需要刪除部分?jǐn)?shù)據(jù)挪出空間，這樣新數(shù)據(jù)才可以添加進(jìn)來。緩存數(shù)據(jù)不能隨機(jī)刪除，一般情況下我們需要根據(jù)某種算法刪除緩存數(shù)據(jù)。常用淘汰算法有 LRU,LFU,FIFO,這篇文章我們聊聊 LRU 算法。

LRU 簡介

LRU 是 Least Recently Used 的縮寫，這種算法認(rèn)為最近使用的數(shù)據(jù)是熱門數(shù)據(jù)，下一次很大概率將會再次被使用。而最近很少被使用的數(shù)據(jù)，很大概率下一次不再用到。當(dāng)緩存容量的滿時候，優(yōu)先淘汰最近很少使用的數(shù)據(jù)。

假設(shè)現(xiàn)在緩存內(nèi)部數(shù)據(jù)如圖所示：

這里我們將列表第一個節(jié)點(diǎn)稱為頭結(jié)點(diǎn)，最后一個節(jié)點(diǎn)為尾結(jié)點(diǎn)。

當(dāng)調(diào)用緩存獲取 key=1 的數(shù)據(jù)，LRU 算法需要將 1 這個節(jié)點(diǎn)移動到頭結(jié)點(diǎn)，其余節(jié)點(diǎn)不變，如圖所示。

然后我們插入一個 key=8 節(jié)點(diǎn)，此時緩存容量到達(dá)上限，所以加入之前需要先刪除數(shù)據(jù)。由于每次查詢都會將數(shù)據(jù)移動到頭結(jié)點(diǎn)，未被查詢的數(shù)據(jù)就將會下沉到尾部節(jié)點(diǎn)，尾部的數(shù)據(jù)就可以認(rèn)為是最少被訪問的數(shù)據(jù)，所以刪除尾結(jié)點(diǎn)的數(shù)據(jù)。

然后我們直接將數(shù)據(jù)添加到頭結(jié)點(diǎn)。

這里總結(jié)一下 LRU 算法具體步驟：

新數(shù)據(jù)直接插入到列表頭部

緩存數(shù)據(jù)被命中，將數(shù)據(jù)移動到列表頭部

緩存已滿的時候，移除列表尾部數(shù)據(jù)。

LRU 算法實(shí)現(xiàn)

上面例子中可以看到，LRU 算法需要添加頭節(jié)點(diǎn)，刪除尾結(jié)點(diǎn)。而鏈表添加節(jié)點(diǎn)/刪除節(jié)點(diǎn)時間復(fù)雜度 O(1)，非常適合當(dāng)做存儲緩存數(shù)據(jù)容器。但是不能使用普通的單向鏈表，單向鏈表有幾點(diǎn)劣勢:

每次獲取任意節(jié)點(diǎn)數(shù)據(jù)，都需要從頭結(jié)點(diǎn)遍歷下去，這就導(dǎo)致獲取節(jié)點(diǎn)復(fù)雜度為 O(N)。

移動中間節(jié)點(diǎn)到頭結(jié)點(diǎn)，我們需要知道中間節(jié)點(diǎn)前一個節(jié)點(diǎn)的信息，單向鏈表就不得不再次遍歷獲取信息。

針對以上問題，可以結(jié)合其他數(shù)據(jù)結(jié)構(gòu)解決。

使用散列表存儲節(jié)點(diǎn)，獲取節(jié)點(diǎn)的復(fù)雜度將會降低為 O(1)。節(jié)點(diǎn)移動問題可以在節(jié)點(diǎn)中再增加前驅(qū)指針，記錄上一個節(jié)點(diǎn)信息，這樣鏈表就從單向鏈表變成了雙向鏈表。

綜上使用雙向鏈表加散列表結(jié)合體，數(shù)據(jù)結(jié)構(gòu)如圖所示:

在雙向鏈表中特意增加兩個『哨兵』節(jié)點(diǎn)，不用來存儲任何數(shù)據(jù)。使用哨兵節(jié)點(diǎn)，增加/刪除節(jié)點(diǎn)的時候就可以不用考慮邊界節(jié)點(diǎn)不存在情況，簡化編程難度，降低代碼復(fù)雜度。

LRU 算法實(shí)現(xiàn)代碼如下，為了簡化 key ，val 都認(rèn)為 int 類型。

public class LRUCache {

Entry head, tail;

int capacity;

int size;

Map cache;

public LRUCache(int capacity) {

this.capacity = capacity;

// 初始化鏈表

initLinkedList();

size = 0;

cache = new HashMap<>(capacity + 2);

}

/**

* 如果節(jié)點(diǎn)不存在，返回 -1.如果存在，將節(jié)點(diǎn)移動到頭結(jié)點(diǎn)，并返回節(jié)點(diǎn)的數(shù)據(jù)。

* @param key

* @return

public int get(int key) {

Entry node = cache.get(key);

if (node == null) {

return -1;

}

// 存在移動節(jié)點(diǎn)

moveToHead(node);

return node.value;

}

/**

* 將節(jié)點(diǎn)加入到頭結(jié)點(diǎn)，如果容量已滿，將會刪除尾結(jié)點(diǎn)

* @param key

* @param value

public void put(int key, int value) {

Entry node = cache.get(key);

if (node != null) {

node.value = value;

moveToHead(node);

return;

}

// 不存在。先加進(jìn)去，再移除尾結(jié)點(diǎn)

// 此時容量已滿刪除尾結(jié)點(diǎn)

if (size == capacity) {

Entry lastNode = tail.pre;

deleteNode(lastNode);

cache.remove(lastNode.key);

size--;

}

// 加入頭結(jié)點(diǎn)

Entry newNode = new Entry();

newNode.key = key;

newNode.value = value;

addNode(newNode);

cache.put(key, newNode);

size++;

}

private void moveToHead(Entry node) {

// 首先刪除原來節(jié)點(diǎn)的關(guān)系

deleteNode(node);

addNode(node);

}

private void addNode(Entry node) {

head.next.pre = node;

node.next = head.next;

node.pre = head;

head.next = node;

}

private void deleteNode(Entry node) {

node.pre.next = node.next;

node.next.pre = node.pre;

}

public static class Entry {

public Entry pre;

public Entry next;

public int key;

public int value;

public Entry(int key, int value) {

this.key = key;

this.value = value;

}

public Entry() {

}

private void initLinkedList() {

head = new Entry();

tail = new Entry();

head.next = tail;

tail.pre = head;

}

public static void main(String[] args) {

LRUCache cache = new LRUCache(2);

cache.put(1, 1);

cache.put(2, 2);

System.out.println(cache.get(1));

cache.put(3, 3);

System.out.println(cache.get(2));

}

LRU 算法分析

緩存命中率是緩存系統(tǒng)的非常重要指標(biāo)，如果緩存系統(tǒng)的緩存命中率過低，將會導(dǎo)致查詢回流到數(shù)據(jù)庫，導(dǎo)致數(shù)據(jù)庫的壓力升高。

結(jié)合以上分析 LRU 算法優(yōu)缺點(diǎn)。

LRU 算法優(yōu)勢在于算法實(shí)現(xiàn)難度不大，對于對于熱點(diǎn)數(shù)據(jù)， LRU 效率會很好。

LRU 算法劣勢在于對于偶發(fā)的批量操作，比如說批量查詢歷史數(shù)據(jù)，就有可能使緩存中熱門數(shù)據(jù)被這些歷史數(shù)據(jù)替換，造成緩存污染，導(dǎo)致緩存命中率下降，減慢了正常數(shù)據(jù)查詢。

LRU 算法改進(jìn)方案

以下方案來源與 MySQL InnoDB LRU 改進(jìn)算法

將鏈表拆分成兩部分，分為熱數(shù)據(jù)區(qū)，與冷數(shù)據(jù)區(qū)，如圖所示。

改進(jìn)之后算法流程將會變成下面一樣:

訪問數(shù)據(jù)如果位于熱數(shù)據(jù)區(qū)，與之前 LRU 算法一樣，移動到熱數(shù)據(jù)區(qū)的頭結(jié)點(diǎn)。

插入數(shù)據(jù)時，若緩存已滿，淘汰尾結(jié)點(diǎn)的數(shù)據(jù)。然后將數(shù)據(jù)插入冷數(shù)據(jù)區(qū)的頭結(jié)點(diǎn)。

處于冷數(shù)據(jù)區(qū)的數(shù)據(jù)每次被訪問需要做如下判斷：

若該數(shù)據(jù)已在緩存中超過指定時間，比如說 1 s，則移動到熱數(shù)據(jù)區(qū)的頭結(jié)點(diǎn)。

若該數(shù)據(jù)存在在時間小于指定的時間，則位置保持不變。

對于偶發(fā)的批量查詢，數(shù)據(jù)僅僅只會落入冷數(shù)據(jù)區(qū)，然后很快就會被淘汰出去。熱門數(shù)據(jù)區(qū)的數(shù)據(jù)將不會受到影響，這樣就解決了 LRU 算法緩存命中率下降的問題。

其他改進(jìn)方法還有 LRU-K，2Q,LIRS 算法，感興趣同學(xué)可以自行查閱。

歡迎關(guān)注我的公眾號：程序通事，獲得日常干貨推送。如果您對我的專題內(nèi)容感興趣，也可以關(guān)注我的博客：studyidea.cn

關(guān)于找一找教程網(wǎng)

本站文章僅代表作者觀點(diǎn)，不代表本站立場，所有文章非營利性免費(fèi)分享。

本站提供了軟件編程、網(wǎng)站開發(fā)技術(shù)、服務(wù)器運(yùn)維、人工智能等等IT技術(shù)文章，希望廣大程序員努力學(xué)習(xí)，讓我們用科技改變世界。

[聊聊緩存淘汰算法-LRU 實(shí)現(xiàn)原理]http://www.zyiz.net/tech/detail-93930.html

總結(jié)

以上是生活随笔為你收集整理的mysql缓存淘汰机制_聊聊缓存淘汰算法-LRU 实现原理的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：《阿凡达2：水之道》再曝新剧照主角杰克
下一篇： mysql crash 如何导出数据库_