當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

Sqlite数据库中索引的使用、索引的优缺点[转]

發(fā)布時(shí)間：2024/1/8 数据库 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 Sqlite数据库中索引的使用、索引的优缺点[转] 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

原文鏈接1? ?原文鏈接2

3. 索引的種類

1）聚集索引：表中行的物理順序與鍵值的邏輯（索引）順序相同。因?yàn)閿?shù)據(jù)的物理順序只能有一種，所以一張表只能有一個(gè)聚集索引。如果一張表沒有聚集索引，那么這張表就沒有順序的概念，所有的新行都會插入到表的末尾。對于聚集索引，葉節(jié)點(diǎn)即存儲了數(shù)據(jù)行，不再有單獨(dú)的數(shù)據(jù)頁。就比如說我小時(shí)候查字典從來不看目錄，我覺得字典本身就是一個(gè)目錄，比如查裴字，只需要翻到p字母開頭的，再按順序找到e。通過這個(gè)方法我每次都能最快的查到老師說的那個(gè)字，得到老師的表揚(yáng)。

2）非聚集索引：表中行的物理順序與索引順序無關(guān)。對于非聚集索引，葉節(jié)點(diǎn)存儲了索引字段值以及指向相應(yīng)數(shù)據(jù)頁的指針。葉節(jié)點(diǎn)緊鄰在數(shù)據(jù)之上，對數(shù)據(jù)頁的每一行都有相應(yīng)的索引行與之對應(yīng)。有時(shí)候查字典，我并不知道這個(gè)字讀什么，那我就不得不通過字典目錄的“部首”來查找了。這時(shí)候我會發(fā)現(xiàn)，目錄中的排序和實(shí)際正文的排序是不一樣的，這對我來說很苦惱，因?yàn)槲也荒鼙葎e人快了，我需要先再目錄中找到這個(gè)字，再根據(jù)頁數(shù)去找到正文中的字。?

4．索引與數(shù)據(jù)的查詢，插入與刪除

1）查詢。查詢操作就和查字典是一樣的。當(dāng)我們?nèi)ゲ檎抑付ㄓ涗洉r(shí)，數(shù)據(jù)庫會先查找根節(jié)點(diǎn)，將待查數(shù)據(jù)與根節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行比較，再通過根節(jié)點(diǎn)的指針查詢下一個(gè)記錄，直到找到這個(gè)記錄。這是一個(gè)簡單的平衡樹的二分搜索的過程，我就不贅述了。在聚集索引中，找到頁節(jié)點(diǎn)即找到了數(shù)據(jù)行，而在非聚集索引中，我們還需要再去讀取數(shù)據(jù)頁。

2）插入。聚集索引的插入操作比較復(fù)雜，最簡單的情況，插入操作會找到對于的數(shù)據(jù)頁，然后為新數(shù)據(jù)騰出空間，執(zhí)行插入操作。如果該數(shù)據(jù)頁已經(jīng)沒有空間，那就需要拆分?jǐn)?shù)據(jù)頁，這是一個(gè)非常耗費(fèi)資源的操作。對于僅有非聚集索引的表，插入只需在表的末尾插入即可。如果也包含了聚集索引，那么也會執(zhí)行聚集索引需要的插入操作。

3）刪除。刪除行后下方的數(shù)據(jù)會向上移動以填補(bǔ)空缺。如果刪除的數(shù)據(jù)是該數(shù)據(jù)頁的最后一行，那么這個(gè)數(shù)據(jù)頁會被回收，它的前后一頁的指針會被改變，被回收的數(shù)據(jù)頁也會在特定的情況被重新使用。與此同時(shí)，對于聚集索引，如果索引頁只剩一條記錄，那么該記錄可能會移動到鄰近的索引表中，原來的索引頁也會被回收。而非聚集索引沒辦法做到這一點(diǎn)，這就會導(dǎo)致出現(xiàn)多個(gè)數(shù)據(jù)頁都只有少量數(shù)據(jù)的情況。

5. 索引的優(yōu)缺點(diǎn)
其實(shí)通過前面的介紹，索引的優(yōu)缺點(diǎn)已經(jīng)一目了然。
先說優(yōu)點(diǎn)：
? ? 1）大大加快數(shù)據(jù)的檢索速度，這也是創(chuàng)建索引的最主要的原因
? ? 2）加速表和表之間的連接，特別是在實(shí)現(xiàn)數(shù)據(jù)的參考完整性方面特別有意義。
? ? 3）在使用分組和排序子句進(jìn)行數(shù)據(jù)檢索時(shí)，同樣可以顯著減少查詢中分組和排序的時(shí)間。

再說缺點(diǎn)：
? 1）創(chuàng)建索引需要耗費(fèi)一定的時(shí)間，但是問題不大，一般索引只要build一次
? 2）索引需要占用物理空間，特別是聚集索引，需要較大的空間
? 3）當(dāng)對表中的數(shù)據(jù)進(jìn)行增加、刪除和修改的時(shí)候，索引也要?jiǎng)討B(tài)的維護(hù)，降低了數(shù)據(jù)的維護(hù)速度，這個(gè)是比較大的問題。

6.索引的使用
? ? ? ?根據(jù)上文的分析，我們大致對什么時(shí)候使用索引有了自己的想法（如果你沒有，回頭再看一遍。。。）。一般我們需要在這些列上建立索引：
1）在經(jīng)常需要搜索的列上，這是毋庸置疑的；?
2）經(jīng)常同時(shí)對多列進(jìn)行查詢，且每列都含有重復(fù)值可以建立組合索引，組合索引盡量要使常用查詢形成索引覆蓋（查詢中包含的所需字段皆包含于一個(gè)索引中，我們只需要搜索索引頁即可完成查詢）。同時(shí)，該組合索引的前導(dǎo)列一定要是使用最頻繁的列。對于前導(dǎo)列的問題，在后面sqlite的索引使用介紹中還會做討論。
3）在經(jīng)常用在連接的列上，這些列主要是一些外鍵，可以加快連接的速度，連接條件要充分考慮帶有索引的表。；?

4）在經(jīng)常需要對范圍進(jìn)行搜索的列上創(chuàng)建索引，因?yàn)樗饕呀?jīng)排序，其指定的范圍是連續(xù)的，同樣，在經(jīng)常需要排序的列上最好也創(chuàng)建索引。

5）在經(jīng)常放到where子句中的列上面創(chuàng)建索引，加快條件的判斷速度。要注意的是where字句中對列的任何操作（如計(jì)算表達(dá)式，函數(shù)）都需要對表進(jìn)行整表搜索，而沒有使用該列的索引。所以查詢時(shí)盡量把操作移到等號右邊。

對于以下的列我們不應(yīng)該創(chuàng)建索引：
1）很少在查詢中使用的列
2）含有很少非重復(fù)數(shù)據(jù)值的列，比如只有0，1，這時(shí)候掃描整表通常會更有效
3）對于定義為TEXT，IMAGE的數(shù)據(jù)不應(yīng)該創(chuàng)建索引。這些字段長度不固定，或許很長，或許為空。
當(dāng)然，對于更新操作遠(yuǎn)大于查詢操作時(shí)，不建立索引。也可以考慮在大規(guī)模的更新操作前drop索引，之后重新創(chuàng)建，不過這就需要把創(chuàng)建索引對資源的消耗考慮在內(nèi)。總之，使用索引需要平衡投入與產(chǎn)出，找到一個(gè)產(chǎn)出最好的點(diǎn)。

7. 在sqlite中使用索引?

1）Sqlite不支持聚集索引，android默認(rèn)需要一個(gè)_id字段，這保證了你插入的數(shù)據(jù)會按“_id”的整數(shù)順序插入，這個(gè)integer類型的主鍵就會扮演和聚集索引一樣的角色。所以不要再在對于聲明為：INTEGER PRIMARY KEY的主鍵上創(chuàng)建索引。

2）很多對索引不熟悉的朋友在表中創(chuàng)建了索引，卻發(fā)現(xiàn)沒有生效，其實(shí)這大多數(shù)和我接下來講的有關(guān)。對于where子句中出現(xiàn)的列要想索引生效，會有一些限制，這就和前導(dǎo)列有關(guān)。所謂前導(dǎo)列，就是在創(chuàng)建復(fù)合索引語句的第一列或者連續(xù)的多列。比如通過：CREATE INDEX comp_ind ON table1(x, y, z)創(chuàng)建索引，那么x,xy,xyz都是前導(dǎo)列，而yz，y，z這樣的就不是。下面講的這些，對于其他數(shù)據(jù)庫或許會有一些小的差別，這里以sqlite為標(biāo)準(zhǔn)。在where子句中，前導(dǎo)列必須使用等于或者in操作，最右邊的列可以使用不等式，這樣索引才可以完全生效。同時(shí)，where子句中的列不需要全建立了索引，但是必須保證建立索引的列之間沒有間隙。舉幾個(gè)例子來看吧：

用如下語句創(chuàng)建索引：

CREATE INDEX idx_ex1 ON ex1(a,b,c,d,e,...,y,z);
這里是一個(gè)查詢語句：
...WHERE a=5 AND b IN (1,2,3) AND c IS NULL AND d='hello'
這顯然對于abcd四列都是有效的，因?yàn)橹挥械扔诤蚷n操作，并且是前導(dǎo)列。
再看一個(gè)查詢語句：
... WHERE a=5 AND b IN (1,2,3) AND c>12 AND d='hello'
那這里只有a，b和c的索引會是有效的，d列的索引會失效，因?yàn)樗赾列的右邊，而c列使用了不等式，根據(jù)使用不等式的限制，c列已經(jīng)屬于最右邊。
最后再看一條：
... WHERE b IN (1,2,3) AND c NOT NULL AND d='hello'

索引將不會被使用，因?yàn)闆]有使用前導(dǎo)列，這個(gè)查詢會是一個(gè)全表查詢。

其實(shí)除了索引，對查詢性能的影響因素還有很多，比如表的連接，是否排序等。影響數(shù)據(jù)庫操作的整體性能就需要考慮更多因素，使用更對的技巧，不得不說這是一個(gè)很大的學(xué)問。

最后在android上使用sqlite寫一個(gè)簡單的例子，看下索引對數(shù)據(jù)庫操作的影響。
創(chuàng)建如下表和索引：
?? db.execSQL("create table if not exists t1(a,b)"); ? ? ? ?
? ?db.execSQL("create index if not exists ia on t1(a,b)");
插入10萬條數(shù)據(jù)，分別對表進(jìn)行如下操作：
select * from t1 where a='90012'
插入：insert into t1(a,b) values('10008','name1.6982235534984673')
更新：update t1 set b='name1.999999' where a = '887'

刪除：delete from t1 where a = '1010'

數(shù)據(jù)如下（5次不同的操作取平均值）：
操作 ??無索引 ? ?有索引
查詢 ??170ms ?5ms
插入 ??65ms ??75ms
更新 ??240ms ?52ms
刪除 ??234ms ?78ms

? ? ? ? 可以看到顯著提升了查詢的速度，稍稍減慢了插入速度，還稍稍提升了更新數(shù)據(jù)和刪除數(shù)據(jù)的速度。如果把更新和刪除中的where子句中的列換成b，速度就和沒有索引一樣了，因?yàn)樗饕АＫ运饕艽蠓忍嵘樵兯俣?#xff0c;對于刪除和更新操作，如果where子句中的列使用了索引，即使需要重新build索引，有可能速度還是比不使用索引要快的。對與插入操作，索引顯然是個(gè)負(fù)擔(dān)。同時(shí)，索引讓db的大小增加了2倍多。

? ? ? ?還有個(gè)要吐槽的是，android中的rawQurey方法，執(zhí)行完sql語句后返回一個(gè)cursor，其實(shí)并沒有完成一個(gè)查詢操作，我在rawquery之前和之后計(jì)算查詢時(shí)間，永遠(yuǎn)是1ms...這讓我無比苦悶。看了下源碼，在對cursor調(diào)用moveToNext這些移動游標(biāo)方法時(shí)，都會最終先調(diào)用getCount方法，而getCount方法才會調(diào)用native方法調(diào)用真正的查詢操作。這種設(shè)計(jì)顯然更加合理。?

轉(zhuǎn)載于:https://www.cnblogs.com/flyant/p/4272137.html

總結(jié)

以上是生活随笔為你收集整理的Sqlite数据库中索引的使用、索引的优缺点[转]的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：宝塔软件商店安装不了php_宝塔安装ph
下一篇： ProxySQL 配置详解及读写分离(+

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

数据库

Sqlite数据库中索引的使用、索引的优缺点[转]

總結(jié)