當(dāng)前位置：首頁 >

InnoDB原理篇：为什么使用索引会变快?

發(fā)布時間：2025/3/15 33 豆豆

生活随笔收集整理的這篇文章主要介紹了 InnoDB原理篇：为什么使用索引会变快? 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

索引

假設(shè)給你一本非常厚的《Java編程思想》閱讀，沒有目錄，你想快速找到某一個章節(jié)的知識點(diǎn)，那估計(jì)得找一會了，如果有目錄就不一樣。

索引其實(shí)就是為了提高數(shù)據(jù)查詢的效率，就像書的目錄一樣，對于數(shù)據(jù)庫的表而言，索引其實(shí)就是它的目錄。

二叉搜索樹

索引的實(shí)現(xiàn)種類繁多，比如常見的有序數(shù)組、哈希表、樹等，不同的結(jié)構(gòu)都有自己的適用場景和局限性，在數(shù)據(jù)庫領(lǐng)域中，樹結(jié)構(gòu)是被廣泛使用。

我們先從最基本的二叉搜索樹說起。

二叉搜索樹的特點(diǎn)是：父節(jié)點(diǎn)左子樹所有結(jié)點(diǎn)的值小于父節(jié)點(diǎn)的值，右子樹所有結(jié)點(diǎn)的值大于父節(jié)點(diǎn)的值，如下圖所示

如果要查id=4的數(shù)據(jù)，按照圖中的搜索順序是索引頁A -> 索引頁B -> 索引頁D -> 數(shù)據(jù)頁0，時間復(fù)雜度是O(log(N))。

也就是說，搜索速度與高度有關(guān)，樹越高，性能越差，假設(shè)100萬行的表，使用二叉樹來存儲，樹高20，磁盤每次隨機(jī)讀一個數(shù)據(jù)塊需要10ms左右，單獨(dú)訪問一個行可能需要20個10ms的時間，這個查詢可真夠慢的。

N叉搜索樹

為了減少磁盤隨機(jī)讀IO，就必須控制好樹的高度，那就不應(yīng)該使用二叉樹，而是使用N叉樹，這里的N代表數(shù)據(jù)塊的大小。

也就說，你一個索引頁存儲的數(shù)據(jù)越多，樹會越矮，InnoDB中就使用了B+樹來實(shí)現(xiàn)索引。

以InnoDB的整數(shù)字段建立索引為例。

一個頁默認(rèn)16kb,整數(shù)（bigint）字段的長度為8B，另外還跟著6B的指向其子樹的指針，這意味著一個索引頁可以存儲接近1200條數(shù)據(jù)(16kb/14B ≈ 1170)。

如果這顆B+樹高度為4，就可以存1200的3次方的值，差不多17億條數(shù)據(jù)。

考慮到樹根節(jié)點(diǎn)總是在內(nèi)存中的，樹的第二層很大概率也在內(nèi)存中，所以一次搜索最多只需要訪問2次磁盤IO。

可能小伙伴會有疑問，為什么樹的根節(jié)點(diǎn)與樹的第二層會在內(nèi)存，第三層、第四層卻沒在？

道理很簡單，看下數(shù)據(jù)大小就清楚了

最后再感受下索引搜索的流程。

假設(shè)1億數(shù)據(jù)量的表，根據(jù)主鍵id建立了B+樹索引，現(xiàn)在搜索id=2699的數(shù)據(jù)，流程如下

內(nèi)存中直接獲取樹根索引頁，對樹根索引頁內(nèi)的目錄進(jìn)行二分查找，定位到第二層的索引頁
內(nèi)存中直接獲取第二層的索引頁，對索引頁內(nèi)的目錄進(jìn)行二分查找，定位到第三層的索引頁
從磁盤加載第三層的索引頁到內(nèi)存中，對索引頁內(nèi)的目錄進(jìn)行二分查找，定位到第四層數(shù)據(jù)頁
從磁盤加載第四層的數(shù)據(jù)頁到內(nèi)存中，數(shù)據(jù)頁變成緩存頁，對緩存頁中的目錄進(jìn)行二分查找，定位到具體的行數(shù)據(jù)

有道無術(shù)，術(shù)可成；有術(shù)無道，止于術(shù)

歡迎大家關(guān)注Java之道公眾號

好文章，我在看??

總結(jié)

以上是生活随笔為你收集整理的InnoDB原理篇：为什么使用索引会变快?的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。