當前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

数据库索引怎么实现的

發(fā)布時間：2024/8/1 数据库 35 豆豆

生活随笔收集整理的這篇文章主要介紹了数据库索引怎么实现的小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 數(shù)據(jù)庫索引怎么實現(xiàn)的

（招銀網(wǎng)絡(luò)科技java面經(jīng)）

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 數(shù)據(jù)庫索引怎么實現(xiàn)的

1 簡介

2索引是如何工作的

簡介

索引數(shù)據(jù)結(jié)構(gòu)類型

哈希表

有序數(shù)組

搜索樹

索引是怎么提升性能的？

3 優(yōu)缺點

4 如何合理的建立索引

應(yīng)該創(chuàng)建索引的

不應(yīng)該創(chuàng)建索引的

聯(lián)合索引是什么?為什么需要注意聯(lián)合索引中的順序

5 索引的類型

唯一索引?

主鍵索引

聚集索引

6 局部性原理與磁盤預讀

7 有關(guān)文章

1 簡介

數(shù)據(jù)庫索引，是數(shù)據(jù)庫管理系統(tǒng)中一個排序的數(shù)據(jù)結(jié)構(gòu)，以協(xié)助快速查詢、更新數(shù)據(jù)庫表中數(shù)據(jù)。

在數(shù)據(jù)之外，數(shù)據(jù)庫系統(tǒng)還維護著滿足特定查找算法的數(shù)據(jù)結(jié)構(gòu)，這些數(shù)據(jù)結(jié)構(gòu)以某種方式引用（指向）數(shù)據(jù)，這樣就可以在這些數(shù)據(jù)結(jié)構(gòu)上實現(xiàn)高級查找算法。這種數(shù)據(jù)結(jié)構(gòu)，就是索引。

索引的數(shù)據(jù)結(jié)構(gòu)和具體存儲引擎的實現(xiàn)有關(guān), 在MySQL中使用較多的索引有Hash索引,B+樹索引等,而我們經(jīng)常使用的InnoDB存儲引擎的默認索引實現(xiàn)為:B+樹索引.

為表設(shè)置索引要付出代價的：一是增加了數(shù)據(jù)庫的存儲空間，二是在插入和修改數(shù)據(jù)時要花費較多的時間(因為索引也要隨之變動)。

上圖展示了一種可能的索引方式。左邊是數(shù)據(jù)表，一共有兩列七條記錄，最左邊的是數(shù)據(jù)記錄的物理地址（注意邏輯上相鄰的記錄在磁盤上也并不是一定物理相鄰的）。為了加快Col2的查找，可以維護一個右邊所示的二叉查找樹，每個節(jié)點分別包含索引鍵值和一個指向?qū)?yīng)數(shù)據(jù)記錄物理地址的指針，這樣就可以運用二叉查找在O(log2n)的復雜度內(nèi)獲取到相應(yīng)數(shù)據(jù)。

2索引是如何工作的

簡介

首先明白為什么索引會增加速度，DB在執(zhí)行一條Sql語句的時候，默認的方式是根據(jù)搜索條件進行全表掃描，遇到匹配條件的就加入搜索結(jié)果集合。如果我們對某一字段增加索引，查詢時就會先去索引列表中一次定位到特定值的行數(shù)，大大減少遍歷匹配的行數(shù)，所以能明顯增加查詢的速度。那么在任何時候都應(yīng)該加索引么？

使用索引的全部意義就是通過縮小一張表中需要查詢的記錄/行的數(shù)目來加快搜索的速度。一個索引是存儲的表中一個特定列的值數(shù)據(jù)結(jié)構(gòu)（最常見的是B-Tree）。索引是在表的列上創(chuàng)建。所以，要記住的關(guān)鍵點是索引包含一個表中列的值，并且這些值存儲在一個數(shù)據(jù)結(jié)構(gòu)中。請記住記住這一點：索引是一種數(shù)據(jù)結(jié)構(gòu) 。

索引數(shù)據(jù)結(jié)構(gòu)類型

三種常見、也比較簡單的數(shù)據(jù)結(jié)構(gòu)，它們分別是哈希表、有序數(shù)組和搜索樹

哈希表

哈希表是一種以鍵-值（key-value）存儲數(shù)據(jù)的結(jié)構(gòu)，我們只要輸入待查找的值即key，就可以找到其對應(yīng)的值即Value。哈希的思路很簡單，把值放在數(shù)組里，用一個哈希函數(shù)把key換算成一個確定的位置，然后把value放在數(shù)組的這個位置。

不可避免地，多個key值經(jīng)過哈希函數(shù)的換算，會出現(xiàn)同一個值的情況。處理這種情況的一種方法是，拉出一個鏈表。

User2和User4根據(jù)身份證號算出來的值都是N，但沒關(guān)系，后面還跟了一個鏈表。假設(shè)，這時候你要查ID_card_n2對應(yīng)的名字是什么，處理步驟就是：首先，將ID_card_n2通過哈希函數(shù)算出N；然后，按順序遍歷，找到User2。

圖中四個ID_card_n的值并不是遞增的，這樣做的好處是增加新的User時速度會很快，只需要往后追加。但缺點是，因為不是有序的，所以哈希索引做區(qū)間查詢的速度是很慢的。

你可以設(shè)想下，如果你現(xiàn)在要找身份證號在[ID_card_X, ID_card_Y]這個區(qū)間的所有用戶，就必須全部掃描一遍了。

哈希表這種結(jié)構(gòu)適用于只有等值查詢的場景，比如Memcached及其他一些NoSQL引擎。

而有序數(shù)組在等值查詢和范圍查詢場景中的性能就都非常優(yōu)秀。還是上面這個根據(jù)身份證號查名字的例子，如果我們使用有序數(shù)組來實現(xiàn)的話，示意圖如下所示：

有序數(shù)組

有序數(shù)組在等值查詢和范圍查詢場景中的性能就都非常優(yōu)秀。還是上面這個根據(jù)身份證號查名字的例子，如果我們使用有序數(shù)組來實現(xiàn)的話，示意圖如下所示：

數(shù)組就是按照身份證號遞增的順序保存的。這時候如果你要查ID_card_n2對應(yīng)的名字，用二分法就可以快速得到，這個時間復雜度是O(log(N))。

同時很顯然，這個索引結(jié)構(gòu)支持范圍查詢。你要查身份證號在[ID_card_X, ID_card_Y]區(qū)間的User，可以先用二分法找到ID_card_X（如果不存在ID_card_X，就找到大于ID_card_X的第一個User），然后向右遍歷，直到查到第一個大于ID_card_Y的身份證號，退出循環(huán)。

如果僅僅看查詢效率，有序數(shù)組就是最好的數(shù)據(jù)結(jié)構(gòu)了。但是，在需要更新數(shù)據(jù)的時候就麻煩了，你往中間插入一個記錄就必須得挪動后面所有的記錄，成本太高。

所以，有序數(shù)組索引只適用于靜態(tài)存儲引擎，比如你要保存的是2017年某個城市的所有人口信息，這類不會再修改的數(shù)據(jù)。

搜索樹

二叉搜索樹也是課本里的經(jīng)典數(shù)據(jù)結(jié)構(gòu)了。還是上面根據(jù)身份證號查名字的例子，如果我們用二叉搜索樹來實現(xiàn)的話，示意圖如下所示：

B-Tree 是最常用的用于索引的數(shù)據(jù)結(jié)構(gòu)。因為它們是時間復雜度低，查找、刪除、插入操作都可以可以在對數(shù)時間內(nèi)完成。另外一個重要原因存儲在B-Tree中的數(shù)據(jù)是有序的。數(shù)據(jù)庫管理系統(tǒng)（RDBMS）通常決定索引應(yīng)該用哪些數(shù)據(jù)結(jié)構(gòu)。但是，在某些情況下，你在創(chuàng)建索引時可以指定索引要使用的數(shù)據(jù)結(jié)構(gòu)。

索引是怎么提升性能的？

因為索引基本上是用來存儲列值的數(shù)據(jù)結(jié)構(gòu)，這使查找這些列值更加快速。如果索引使用最常用的數(shù)據(jù)結(jié)構(gòu)-B-Tree-那么其中的數(shù)據(jù)是有序的。有序的列值可以極大的提升性能。下面解釋原因。

假設(shè)我們在 Employee_Name這一列上創(chuàng)建一個B-Tree索引。這意味著當我們用之前的SQL查找姓名是‘Jesus’的雇員時，不需要再掃描全表。而是用索引查找去查找名字為‘Jesus’的雇員，因為索引已經(jīng)按照按字母順序排序。索引已經(jīng)排序意味著查詢一個名字會快很多，因為名字少字母為‘J’的員工都是排列在一起的。另外重要的一點是，索引同時存儲了表中相應(yīng)行的指針以獲取其他列的數(shù)據(jù)。

數(shù)據(jù)庫索引里究竟存的是什么？

你現(xiàn)在已經(jīng)知道數(shù)據(jù)庫索引是創(chuàng)建在表的某列上的，并且存儲了這一列的所有值。但是，需要理解的重點是數(shù)據(jù)庫索引并不存儲這個表中其他列（字段）的值。舉例來說，如果我們在Employee_Name列創(chuàng)建索引，那么列Employee_Age和Employee_Address上的值并不會存儲在這個索引當中。如果我們確實把其他所有字段也存儲在個這個索引中，那就成了拷貝一整張表做為索引-這樣會占用太大的空間而且會十分低效。

索引存儲了指向表中某一行的指針

如果我們在索引里找到某一條記錄作為索引的列的值，如何才能找到這一條記錄的其它值呢？這是很簡單 - 數(shù)據(jù)庫索引同時存儲了指向表中的相應(yīng)行的指針。指針是指一塊內(nèi)存區(qū)域，該內(nèi)存區(qū)域記錄的是對硬盤上記錄的相應(yīng)行的數(shù)據(jù)的引用。因此，索引中除了存儲列的值，還存儲著一個指向在行數(shù)據(jù)的索引。也就是說，索引中的Employee_Name這列的某個值（或者節(jié)點）可以描述為 (“Jesus”, 0x82829)， 0x82829 就是包含 “Jesus”那行數(shù)據(jù)在硬盤上的地址。如果沒有這個引用，你就只能訪問到一個單獨的值（“Jesus”），而這樣沒有意義，因為你不能獲取這一行記錄的employee的其他值-例如地址（address）和年齡（age）。

3 優(yōu)缺點

創(chuàng)建索引可以大大提高系統(tǒng)的性能。

第一，通過創(chuàng)建唯一性索引，可以保證數(shù)據(jù)庫表中每一行數(shù)據(jù)的唯一性。

第二，可以大大加快數(shù)據(jù)的檢索速度，這也是創(chuàng)建索引的最主要的原因。

第三，可以加速表和表之間的連接，特別是在實現(xiàn)數(shù)據(jù)的參考完整性方面特別有意義。

第四，在使用分組和排序子句進行數(shù)據(jù)檢索時，同樣可以顯著減少查詢中分組和排序的時間。

第五，通過使用索引，可以在查詢的過程中，使用優(yōu)化隱藏器，提高系統(tǒng)的性能。

也許會有人要問：增加索引有如此多的優(yōu)點，為什么不對表中的每一個列創(chuàng)建一個索引呢？因為，增加索引也有許多不利的方面。

第一，創(chuàng)建索引和維護索引要耗費時間，這種時間隨著數(shù)據(jù)量的增加而增加。（時間）

第二，索引需要占物理空間，除了數(shù)據(jù)表占數(shù)據(jù)空間之外，每一個索引還要占一定的物理空間，如果要建立聚簇索引，那么需要的空間就會更大。（空間）

第三，當對表中的數(shù)據(jù)進行增加、刪除和修改的時候，索引也要動態(tài)的維護，這樣就降低了數(shù)據(jù)的維護速度。（維護）

4 如何合理的建立索引

應(yīng)該創(chuàng)建索引的

索引是建立在數(shù)據(jù)庫表中的某些列的上面。在創(chuàng)建索引的時候，應(yīng)該考慮在哪些列上可以創(chuàng)建索引，在哪些列上不能創(chuàng)建索引。一般來說，應(yīng)該在這些列上創(chuàng)建索引：

1 在經(jīng)常需要搜索的列上，可以加快搜索的速度；（字段的使用頻率）

2 在作為主鍵的列上，強制該列的唯一性和組織表中數(shù)據(jù)的排列結(jié)構(gòu)；在經(jīng)常用在連接的列上，這些列主要是一些外鍵，可以加快連接的速度；

3 在經(jīng)常需要根據(jù)范圍進行搜索的列上創(chuàng)建索引，因為索引已經(jīng)排序，其指定的范圍是連續(xù)的；

4 在經(jīng)常需要排序的列上創(chuàng)建索引，因為索引已經(jīng)排序，這樣查詢可以利用索引的排序，加快排序查詢時間；

5在經(jīng)常使用在WHERE子句中的列上面創(chuàng)建索引，加快條件的判斷速度。

6 在經(jīng)常用在連接的列上，這些列主要是一些外鍵，可以加快連接的速度；

不應(yīng)該創(chuàng)建索引的

同樣，對于有些列不應(yīng)該創(chuàng)建索引。一般來說，不應(yīng)該創(chuàng)建索引的的這些列具有下列特點：

1于那些在查詢中很少使用或者參考的列不應(yīng)該創(chuàng)建索引。這是因為，既然這些列很少使用到，因此有索引或者無索引，并不能提高查詢速度。相反，由于增加了索引，反而降低了系統(tǒng)的維護速度和增大了空間需求。

2對于那些只有很少數(shù)據(jù)值的列也不應(yīng)該增加索引。這是因為，由于這些列的取值很少，例如人事表的性別列，在查詢的結(jié)果中，結(jié)果集的數(shù)據(jù)行占了表中數(shù)據(jù)行的很大比例，即需要在表中搜索的數(shù)據(jù)行的比例很大。增加索引，并不能明顯加快檢索速度。

3對于那些定義為text, image和bit數(shù)據(jù)類型的列不應(yīng)該增加索引。這是因為，這些列的數(shù)據(jù)量要么相當大，要么取值很少。

4當修改性能遠遠大于檢索性能時，不應(yīng)該創(chuàng)建索引。這是因為，修改性能和檢索性能是互相矛盾的。當增加索引時，會提高檢索性能，但是會降低修改性能。當減少索引時，會提高修改性能，降低檢索性能。因此，當修改性能遠遠大于檢索性能時，不應(yīng)該創(chuàng)建索引。

聯(lián)合索引是什么?為什么需要注意聯(lián)合索引中的順序

MySQL可以使用多個字段同時建立一個索引,叫做聯(lián)合索引.在聯(lián)合索引中,如果想要命中索引,需要按照建立索引時的字段順序挨個使用,否則無法命中索引.

具體原因為:

MySQL使用索引時需要索引有序,假設(shè)現(xiàn)在建立了"name,age,school"的聯(lián)合索引,那么索引的排序為: 先按照name排序,如果name相同,則按照age排序,如果age的值也相等,則按照school進行排序.

當進行查詢時,此時索引僅僅按照name嚴格有序,因此必須首先使用name字段進行等值查詢,之后對于匹配到的列而言,其按照age字段嚴格有序,此時可以使用age字段用做索引查找,,,以此類推.因此在建立聯(lián)合索引的時候應(yīng)該注意索引列的順序,一般情況下,將查詢需求頻繁或者字段選擇性高的列放在前面.此外可以根據(jù)特例的查詢或者表結(jié)構(gòu)進行單獨的調(diào)整.

5 索引的類型

根據(jù)數(shù)據(jù)庫的功能，可以在數(shù)據(jù)庫設(shè)計器中創(chuàng)建三種索引：唯一索引、主鍵索引和聚集索引。

唯一索引?

唯一索引是不允許其中任何兩行具有相同索引值的索引。

當現(xiàn)有數(shù)據(jù)中存在重復的鍵值時，大多數(shù)數(shù)據(jù)庫不允許將新創(chuàng)建的唯一索引與表一起保存。數(shù)據(jù)庫還可能防止添加將在表中創(chuàng)建重復鍵值的新數(shù)據(jù)。例如，如果在employee表中職員的姓(lname)上創(chuàng)建了唯一索引，則任何兩個員工都不能同姓。

主鍵索引

數(shù)據(jù)庫表經(jīng)常有一列或列組合，其值唯一標識表中的每一行。該列稱為表的主鍵。

在數(shù)據(jù)庫關(guān)系圖中為表定義主鍵將自動創(chuàng)建主鍵索引，主鍵索引是唯一索引的特定類型。該索引要求主鍵中的每個值都唯一。當在查詢中使用主鍵索引時，它還允許對數(shù)據(jù)的快速訪問。

聚集索引

在聚集索引中，表中行的物理順序與鍵值的邏輯（索引）順序相同。一個表只能包含一個聚集索引。

如果某索引不是聚集索引，則表中行的物理順序與鍵值的邏輯順序不匹配。與非聚集索引相比，聚集索引通常提供更快的數(shù)據(jù)訪問速度。

6 局部性原理與磁盤預讀

由于存儲介質(zhì)的特性，磁盤本身存取就比主存慢很多，再加上機械運動耗費，磁盤的存取速度往往是主存的幾百分分之一，因此為了提高效率，要盡量減少磁盤I/O。為了達到這個目的，磁盤往往不是嚴格按需讀取，而是每次都會預讀，即使只需要一個字節(jié)，磁盤也會從這個位置開始，順序向后讀取一定長度的數(shù)據(jù)放入內(nèi)存。這樣做的理論依據(jù)是計算機科學中著名的局部性原理：當一個數(shù)據(jù)被用到時，其附近的數(shù)據(jù)也通常會馬上被使用。程序運行期間所需要的數(shù)據(jù)通常比較集中。

由于磁盤順序讀取的效率很高（不需要尋道時間，只需很少的旋轉(zhuǎn)時間），因此對于具有局部性的程序來說，預讀可以提高I/O效率。

預讀的長度一般為頁（page）的整倍數(shù)。頁是計算機管理存儲器的邏輯塊，硬件及操作系統(tǒng)往往將主存和磁盤存儲區(qū)分割為連續(xù)的大小相等的塊，每個存儲塊稱為一頁（在許多操作系統(tǒng)中，頁得大小通常為4k），主存和磁盤以頁為單位交換數(shù)據(jù)。當程序要讀取的數(shù)據(jù)不在主存中時，會觸發(fā)一個缺頁異常，此時系統(tǒng)會向磁盤發(fā)出讀盤信號，磁盤會找到數(shù)據(jù)的起始位置并向后連續(xù)讀取一頁或幾頁載入內(nèi)存中，然后異常返回，程序繼續(xù)運行。

7 有關(guān)文章

https://blog.csdn.net/weixin_41563161/article/details/101227932

數(shù)據(jù)庫基本知識

https://blog.csdn.net/weixin_41563161/article/details/102457643

mysql45深入淺出索引

https://blog.csdn.net/weixin_41563161/article/details/102737347#1.%20什么是索引%3F

?數(shù)據(jù)庫常見面試知識

https://blog.csdn.net/weixin_41563161/article/details/102966786

mysql45怎么給字符串字段加索引？

https://blog.csdn.net/weixin_41563161/article/details/102859171

mysql45普通索引和唯一索引，應(yīng)該怎么選擇？

https://blog.csdn.net/weixin_41563161/article/details/102957941

mysql45 MySQL為什么有時候會選錯索引？

https://blog.csdn.net/weixin_41563161/article/details/101228148

mysql基本知識

https://blog.csdn.net/weiliangliang111/article/details/51333169

數(shù)據(jù)庫索引到底是什么，是怎樣工作的？

總結(jié)

以上是生活随笔為你收集整理的数据库索引怎么实现的的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： github电脑壁纸_这可能是2020年
下一篇：数据库索引面试题

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

数据库

数据库索引怎么实现的

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 數(shù)據(jù)庫索引怎么實現(xiàn)的

1 簡介

2索引是如何工作的

簡介

索引數(shù)據(jù)結(jié)構(gòu)類型

哈希表

有序數(shù)組

搜索樹

索引是怎么提升性能的？

3 優(yōu)缺點

4 如何合理的建立索引

應(yīng)該創(chuàng)建索引的

不應(yīng)該創(chuàng)建索引的

聯(lián)合索引是什么?為什么需要注意聯(lián)合索引中的順序

5 索引的類型

唯一索引?

主鍵索引

聚集索引

6 局部性原理與磁盤預讀

7 有關(guān)文章

總結(jié)