日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

MySQL数据库:SQL优化与索引优化

發(fā)布時間:2024/9/30 数据库 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 MySQL数据库:SQL优化与索引优化 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

一、索引優(yōu)化:

1、like語句的前導(dǎo)模糊查詢不使用索引:

select * from doc where title like '%XX';? ?--不能使用索引
select * from doc where title like 'XX%';? ?--非前導(dǎo)模糊查詢,可以使用索引

2、負(fù)向條件查詢不能使用索引:

負(fù)向條件有:!=、<>、not in、not exists、not like?等

例如下面SQL語句:(假設(shè)status的取值為0、1、2、3、4)

select * from doc where status != 1 and status != 2;? ? ?--不能使用索引

select * from doc where status in (0,3,4);? ? ? ? ? ? ? ? ? ? ? --優(yōu)化為?in?查詢,可以使用索引

3、范圍條件右邊的列不能使用索引(范圍列可以用到索引):

范圍條件有:<、<=、>、>=、between等。

索引最多用于一個范圍列,如果查詢條件中有兩個范圍列則無法全用到索引。

假如有聯(lián)合索引?(emp_no?、title、from_date?),那么下面的?SQL?中?emp_no?可以用到索引,而title?和?from_date?則使用不到索引。

select * from employees.titles where emp_no < 10010' and title='Senior Engineer'and from_date between '1986-01-01' and '1986-12-31'

4、在索引列做任何操作(計算、函數(shù)、表達(dá)式)會導(dǎo)致索引失效而轉(zhuǎn)向全表掃描:

  • select * from doc where YEAR(create_time) <= '2016';? ? ? ? ?-- 不能使用索引
  • select * from doc where create_time<= '2016-01-01';? ? ? ? ? ? -- 可以使用索引
  • select * from order where date < = CURDATE();? ? ? ? ? ? ? ? ?-- 不能使用索引
  • select * from order where date < = '2018-01-2412:00:00';? ? ?-- 可以使用索引
  • select id from t where substring(name,1,3)=’abc’? ? ? ? ? ? ? ? ? ?-- 不能使用索引
  • select id from t where name like ‘a(chǎn)bc%’? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-- 可以使用索引
  • select id from t where num/2=100? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??? ? ? -- 不能使用索引
  • select id from t where num=100*2? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-- 可以使用索引

5、where 子句中索引列使用參數(shù),也會導(dǎo)致索引失效:

因為SQL只有在運行時才會解析局部變量,但優(yōu)化程序不能將訪問計劃的選擇推遲到運行時;它必須在編譯時進(jìn)行選擇。然而,如果在編譯時建立訪問計劃,變量的值還是未知的,因而無法作為索引選擇的輸入項。如下面語句將進(jìn)行全表掃描:

select id from t where num=@num? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?-- 不能使用索引

select id from t with(index(索引名)) where num=@num? ?--可以改為強(qiáng)制查詢使用索引:

6、強(qiáng)制類型轉(zhuǎn)換會導(dǎo)致全表掃描:

字符串類型不加單引號會導(dǎo)致索引失效,因為mysql會自己做類型轉(zhuǎn)換,相當(dāng)于在索引列上進(jìn)行了操作。?

如果?phone?字段是?varchar?類型,則下面的?SQL?不能命中索引,因為內(nèi)部發(fā)生的類型轉(zhuǎn)換。

select * from user where phone=13800001234;? ? ? -- 不能使用索引

select * from user where phone='13800001234';? ? ?-- 可以使用索引

7、is null, is not null 在無法使用索引,不過在mysql的高版本已經(jīng)做了優(yōu)化,允許使用索引

select id from t where num is null;? ? ?-- mysql低版本不能使用索引

select id from t where num=0;? ? ? ? ? ?-- 可以在num上設(shè)置默認(rèn)值0,確保表中num列沒有null值,然后這樣查詢

8、使用組合索引時,要符合最左前綴原則:

組合索引的字段數(shù)不允許超過5個。如果在a,b,c三個字段上建立聯(lián)合索引 index(a,b,c),那么他會自動建立?a、(a,b)、(a,b,c) 三組索引。?

(1)建立聯(lián)合索引的時候,區(qū)分度最高的字段在最左邊:

(2)存在等號和非等號混合判斷條件時,在建立索引時,把等號條件的列前置,如?where a > ? and b= ?,那么即使?a?的區(qū)分度更高,也必須把?b?放在索引的最前列。

(3)最左前綴查詢時,并不是指SQL語句的where順序要和聯(lián)合索引一致,但還是建議?where 條件的順序和聯(lián)合索引一致。

(4)假如index(a,b,c),?where a=3 and b like 'abc%' and c=4,a能用,b能用,c不能用。

9、利用覆蓋索引來進(jìn)行查詢操作,避免回表,減少select * 的使用?:

覆蓋索引:被查詢列要被所建的索引覆蓋,被查詢列的數(shù)據(jù)能從索引中直接取得,不用通過行定位符?再到?row?上獲取,加速查詢速度。

例如登錄業(yè)務(wù)需求,SQL語句如下。

Select uid, login_time from user where login_name=? and passwd=?

可以建立(login_name, passwd,?login_time)的聯(lián)合索引,由于?login_time?已經(jīng)建立在索引中了,被查詢的?uid?和?login_time?就不用去?row?上獲取數(shù)據(jù)了,從而加速查詢。

10、利用索引下推減少回表的次數(shù):

索引下推是Mysql5.6版本推出的功能,用于優(yōu)化查詢。

  • 不使用索引下推的情況下,在使用非主鍵索引進(jìn)行查詢時,存儲引擎通過索引檢索到數(shù)據(jù),然后返回給MySQL服務(wù)層,服務(wù)層然后判斷數(shù)據(jù)是否符合條件 。
  • 使用索引下推的情況下,如果存在某些被索引的列的判斷條件時,MySQL服務(wù)層將這一部分判斷條件傳遞給存儲引擎,然后由存儲引擎通過判斷索引是否符合MySQL服務(wù)層傳遞的條件,只有當(dāng)索引符合條件時才會將數(shù)據(jù)檢索出來返回給MySQL服務(wù)層。

所以,索引下推就是存儲引擎查詢數(shù)據(jù)時,根據(jù)查詢條件過濾掉一些記錄,減少回表的次數(shù),也可以減少MySQL服務(wù)層從存儲引擎接收數(shù)據(jù)量。

11、使用前綴索引:

短索引不僅可以提高查詢性能而且可以節(jié)省磁盤空間和I/O操作,減少索引文件的維護(hù)開銷,但缺點是不能用于?ORDER BY?和?GROUP BY?操作,也不能用于覆蓋索引。比如有一個varchar(255)的列,如果該列在前10個或20個字符內(nèi),可以做到既使前綴索引的區(qū)分度接近全列索引,那么就不要對整個列進(jìn)行索引。為了減少key_len,可以考慮創(chuàng)建前綴索引,即指定一個前綴長度,可以使用count(distinct leftIndex(列名,?索引長度))/count(*)?來計算前綴索引的區(qū)分度(計算前綴索引的區(qū)分度在文章第三部分會介紹)。

12、order by、group by后面的列如果有索引,可以利用索引的有序性可以消除排序帶來的CPU開銷。

(1)order?by?最后的字段是組合索引的一部分,并且放在索引組合順序的最后,避免出現(xiàn)file_sort?的情況,影響查詢性能。例如對于語句?where a= ? and b= ? order by c,可以建立聯(lián)合索引(a,b,c)。

(2)如果索引中有范圍查找,那么索引有序性無法利用,如?WHERE ?a > 10 ORDER BY b; 索引(a,b)無法排序。

(3)如果是前綴索引,是不能消除排序的

(4)order by排序字段順序,即asc/desc升降要跟索引保持一致,充分利用索引的有序性來消除排序帶來的CPU開銷

12、進(jìn)行join聯(lián)表查詢的字段需要建立索引,join最好不要超過三個表,需要?join?的字段,數(shù)據(jù)類型必須一致:

多表關(guān)聯(lián)查詢時,保證被關(guān)聯(lián)的字段需要有索引。left join是由左邊決定的,左邊的數(shù)據(jù)一定都有,所以右邊是我們的關(guān)鍵點,建立索引要建右邊的。當(dāng)然如果索引在左邊,可以用right join。

13、單表索引建議控制在5個以內(nèi)。

索引不是越多越好,索引固然可以提高相應(yīng)的 select 的效率,但同時也降低了 insert 及 update 的效率,因為 insert 或 update 時有可能會重建索引,同時也會暫用空間。一個表的索引數(shù)較好不要超過5個。

14、SQL 性能優(yōu)化 explain 中的 type:至少要達(dá)到 range 級別,要求是 ref 級別,如果可以是 consts 最好。

consts:單表中最多只有一個匹配行(主鍵或者唯一索引),在優(yōu)化階段即可讀取到數(shù)據(jù)。

ref:使用普通的索引

range:對索引進(jìn)行范圍檢索。

當(dāng)?type=index?時,索引物理文件全掃,速度非常慢。

15、業(yè)務(wù)上具有唯一特性的字段,即使是多個字段的組合,也必須建成唯一索引,防止臟數(shù)據(jù)產(chǎn)生:

不要以為唯一索引影響了?insert?速度,這個速度損耗可以忽略,但提高查找速度是明顯的。另外,即使在應(yīng)用層做了非常完善的校驗控制,只要沒有唯一索引,根據(jù)墨菲定律,必然。

16、更新十分頻繁、數(shù)據(jù)區(qū)分度不高的列不宜建立索引:

數(shù)據(jù)更新會變更?B+?樹,在更新頻繁的字段建立索引會大大降低數(shù)據(jù)庫性能。類似于“性別”這種區(qū)分度不大的屬性,建立索引是沒有什么意義的,不能有效過濾數(shù)據(jù),性能與全表掃描類似。一般區(qū)分度在80%以上的時候就可以建立索引,區(qū)分度可以使用?count(distinct(列名))/count(*)?來計算。

二、SQL語句優(yōu)化:

1、減少請求的數(shù)據(jù)量:

(1)只返回必要的列,用具體的字段列表代替 select * 語句

MySQL數(shù)據(jù)庫是按照行的方式存儲,而數(shù)據(jù)存取操作都是以一個頁大小進(jìn)行IO操作的,每個IO單元中存儲了多行,每行都是存儲了該行的所有字段。所以無論取一個字段還是多個字段,實際上數(shù)據(jù)庫在表中需要訪問的數(shù)據(jù)量其實是一樣的。但是如果查詢的字段都在索引中,也就是覆蓋索引,那么可以直接從索引中獲取對應(yīng)的內(nèi)容直接返回,不需要進(jìn)行回表,減少IO操作。除此之外,當(dāng)存在 order by 操作的時候,select 子句中的字段多少會在很大程度上影響到我們的排序效率。

(2)只返回必要的行,使用 Limit 語句來限制返回的數(shù)據(jù)。如果不使用 Limit? 的話,MySQL將會一行一行的將全部結(jié)果按照順序查找,最后返回結(jié)果,借助 Limit 可以實現(xiàn)當(dāng)找到指定行數(shù)時,直接返回查詢結(jié)果,提高效率?

2、優(yōu)化深度分頁的場景:利用延遲關(guān)聯(lián)或者子查詢

對于 limit m, n 的分頁查詢,越往后面翻頁(即m越大的情況下)SQL的耗時會越來越長,對于這種應(yīng)該先取出主鍵id,然后通過主鍵id跟原表進(jìn)行Join關(guān)聯(lián)查詢。因為MySQL?并不是跳過?offset?行,而是取?offset+N?行,然后放棄前?offset?行,返回?N?行,那當(dāng)?offset?特別大的時候,效率就非常的低下,要么控制返回的總頁數(shù),要么對超過特定閾值的頁數(shù)進(jìn)行?SQL?改寫。

延遲關(guān)聯(lián)示例如下,先快速定位需要獲取的?id?段,然后再關(guān)聯(lián):

# 延遲關(guān)聯(lián):通過使用覆蓋索引查詢返回需要的主鍵,再根據(jù)主鍵關(guān)聯(lián)原表獲得需要的數(shù)據(jù)

#?覆蓋索引:select的數(shù)據(jù)列只用從索引中就能夠得到,不用回表查詢

select a.* from 表1 a,(select id from 表1 where 條件 limit 100000,20) b where a.id=b.id;

但對于深度分頁的情況,最好還是將上次遍歷到的最末尾的數(shù)據(jù)ID傳給數(shù)據(jù)庫,然后直接定位到該ID處 再 往后面遍歷數(shù)據(jù)

3、分解大連接查詢:

將一個大連接查詢分解成對每一個表進(jìn)行一次單表查詢,然后在應(yīng)用程序中進(jìn)行關(guān)聯(lián),這樣做的好處有:

  • (1)減少鎖競爭;
  • (2)讓緩存更高效。對于連接查詢,如果其中一個表發(fā)生變化,那么整個查詢緩存就無法使用。而分解后的多個查詢,即使其中一個表發(fā)生變化,對其它表的查詢緩存依然可以使用。
  • (3)分解成多個單表查詢,這些單表查詢的緩存結(jié)果更可能被其它查詢使用到,從而減少冗余記錄的查詢。
  • (4)在應(yīng)用層進(jìn)行連接,可以更容易對數(shù)據(jù)庫進(jìn)行拆分,從而更容易做到高性能和可伸縮。
  • (5)查詢本身效率也可能會有所提升。比如使用 IN() 代替連接查詢,可以讓 MySQL 按照 ID 順序進(jìn)行查詢,這可能比隨機(jī)的連接要更高效。

4、避免使用select的內(nèi)聯(lián)子查詢:

在select后面有子查詢的情況稱為內(nèi)聯(lián)子查詢,SQL返回多少行,子查詢就需要執(zhí)行過多少次,嚴(yán)重影響SQL性能。

5、盡量使用Join代替子查詢:

由于MySQL的優(yōu)化器對于子查詢的處理能力比較弱,所以不建議使用子查詢,可以改寫成Inner Join,之所以 join 連接效率更高,是因為 MySQL不需要在內(nèi)存中創(chuàng)建臨時表

select b.member_id,b.member_type, a.create_time,a.device_model from member_operation_log a inner join (select member_id,member_type from member_base_info where `status` = 1) as b on a.member_id = b.member_id;

6、多張大數(shù)據(jù)量的表進(jìn)行JOIN連接查詢,最好先過濾在JOIN:

在多個表進(jìn)行 join 連接查詢的時候,最好先在一個表上先過濾好數(shù)據(jù),然后再用過濾好的結(jié)果集與另外的表 Join,這樣可以盡可能多的減少不必要的 IO 操作,大大節(jié)省 IO 操作所消耗的時間

7、避免在使用or來連接查詢條件:

如果一個字段有索引,一個字段沒有索引,將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。

8、union、in、or 都能夠命中索引,但推薦使用 in:

(1)union:能夠命中索引,并且MySQL?耗費的?CPU?最少

select * from doc where status=1
union all?
select * from doc where status=2;

(2)in:能夠命中索引,查詢優(yōu)化耗費的?CPU?比?union all?多,但可以忽略不計

select * from doc where status in (1, 2);

(3)or:新版的?MySQL?能夠命中索引,但是如果一個字段有建立索引、一個字段沒有建立索引,那么將導(dǎo)致索引失效而進(jìn)行全表掃描,or 查詢優(yōu)化耗費的?CPU?比?in?多

select * from doc where status = 1 or status = 2

對于上面三種關(guān)鍵詞:union all 分兩步執(zhí)行,而 in 和 or 只用了一步,效率高一點。用 or 的執(zhí)行時間比 in 時間長。因為使用 or 條件查詢,會先判斷一個條件進(jìn)行篩選,再判斷 or 中另外的條件再篩選,而 in 查詢直接一次在 in 的集合里篩選,并且or 查詢優(yōu)化耗費的?CPU?比?in?多,所以推薦使用in

9、對于連續(xù)的數(shù)值,能用 between 就不要用 in:

10、小表驅(qū)動大表,即小的數(shù)據(jù)集驅(qū)動大的數(shù)據(jù)集:

in 和 exists 都可以用于子查詢,那么 MySQL 中 in 和 exists 有什么區(qū)別呢?

  • (1)使用exists時會先進(jìn)行外表查詢,將查詢到的每行數(shù)據(jù)帶入到內(nèi)表查詢中看是否滿足條件;使用in一般會先進(jìn)行內(nèi)表查詢獲取結(jié)果集,然后對外表查詢匹配結(jié)果集,返回數(shù)據(jù)。

  • (2)in在內(nèi)表查詢或者外表查詢過程中都會用到索引;exists僅在內(nèi)表查詢時會用到索引

  • (3)一般來說,當(dāng)子查詢的結(jié)果集比較大,外表較小使用exist效率更高;當(dāng)子查詢的結(jié)果集較小,外表較大時,使用in效率更高。

  • (4)對于 not in 和 not exists,not exists 效率比 not in 的效率高,與子查詢的結(jié)果集無關(guān),因為 not in 對于內(nèi)外表都進(jìn)行了全表掃描,沒有使用到索引。not exists的子查詢中可以用到表上的索引。

11、使用union all 替換 union:

當(dāng)SQL語句需要union兩個查詢結(jié)果集合時,這兩個結(jié)果集合會以union all的方式被合并,然后再輸出最終結(jié)果前進(jìn)行排序。如果用union all替代union,這樣排序就不是不要了,效率就會因此得到提高.。需要注意的是,UNION ALL 將重復(fù)輸出兩個結(jié)果集合中相同記錄。

12、優(yōu)化Group by,使用where子句替換Having子句:

避免使用having子句,having只會在檢索出所有記錄之后才會對結(jié)果集進(jìn)行過濾,這個處理需要排序分組,如果能通過where子句提前過濾查詢的數(shù)目,就可以減少這方面的開銷。

on、where、having這三個都可以加條件的子句,on是最先執(zhí)行,where次之,having最后。

提高GROUP BY 語句的效率, 可以通過將不需要的記錄在GROUP BY 之前過濾掉。

低效:?SELECT JOB, AVG(SAL)?FROM EMP?GROUP by JOB HAVING JOB = ‘PRESIDENT'?OR JOB = ‘MANAGER'?

高效:?SELECT JOB, AVG(SAL)?FROM EMP?WHERE JOB = ‘PRESIDENT'?OR JOB = ‘MANAGER'?GROUP by JOB

13、盡量使用數(shù)字型字段:

若只含數(shù)值信息的字段盡量不要設(shè)計為字符型,這會降低查詢和連接的性能。引擎在處理查詢和連接時會逐個比較字符串中每一個字符,而對于數(shù)字型而言只需要比較一次就夠了。

14、寫出統(tǒng)一的SQL語句:

對于以下兩句SQL語句,很多人都認(rèn)為是相同的。不過數(shù)據(jù)庫查詢優(yōu)化器則認(rèn)為是不同的,雖然只是大小寫不同,但必須進(jìn)行兩次解析,生成2個執(zhí)行計劃。所以應(yīng)該保證相同的查詢語句在任何地方都一致,多一個空格都不行。

  • select * from dual
  • select * From dual

15、使用復(fù)合索引須遵守最左前綴原則:

復(fù)合索引必須使用到最左邊字段作為條件時才能保證系統(tǒng)使用該索引,否則該索引將不會被使用,并且應(yīng)盡可能的讓字段順序與索引順序相一致。

16、當(dāng)需要全表刪除且無需回滾時,使用Truncate替代delete:

drop、truncate、delete的區(qū)別:https://blog.csdn.net/a745233700/article/details/85238118

17、使用表的別名:

當(dāng)在SQL語句中連接多個表時, 使用表的別名并把別名前綴用于每個Column上,這樣可以減少解析的時間并減少那些由Column歧義引起的語法錯誤。

18、避免使用耗費資源的操作:

帶有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY的SQL語句,會啟動SQL引擎執(zhí)行耗費資源的排序功能,DISTINCT需要一次排序操作,而其他的至少需要執(zhí)行兩次排序。通常。帶有UNION, MINUS , INTERSECT的SQL語句都可以用其他方式重寫,如果你的數(shù)據(jù)庫的SORT_AREA_SIZE調(diào)配得好, 使用UNION , MINUS, INTERSECT也是可以考慮的, 畢竟它們的可讀性很強(qiáng)。

19、Update 語句,如果只更改1、2個字段,不要Update全部字段,否則頻繁調(diào)用會引起明顯的性能消耗,同時帶來大量日志。

20、應(yīng)盡可能的避免更新聚簇索引數(shù)據(jù)列,因為聚簇索引數(shù)據(jù)列的順序就是表記錄的物理存儲順序,一旦該列值改變將導(dǎo)致整個表記錄的順序的調(diào)整,會耗費相當(dāng)大的資源。

21、盡量使用表變量來代替臨時表。

22、考慮使用“臨時表”暫存中間結(jié)果。臨時表并不是不可使用,適當(dāng)?shù)厥褂盟鼈兛梢允鼓承┎樵兏行?#xff0c;例如,當(dāng)需要重復(fù)引用大型表或常用表中的某個數(shù)據(jù)集時。將臨時結(jié)果暫存在臨時表,后面的查詢就在臨時表中查詢了,這可以避免程序中多次掃描主表,也大大減少了程序執(zhí)行中“共享鎖”阻塞“更新鎖”,減少了阻塞,提高了并發(fā)性能。但是,對于一次性事件,較好使用導(dǎo)出表。

23、在新建臨時表時,如果一次性插入數(shù)據(jù)量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果數(shù)據(jù)量不大,為了緩和系統(tǒng)表的資源,應(yīng)先create table,然后insert。

24、如果使用到了臨時表,在存儲過程的最后務(wù)必將所有的臨時表顯式刪除,先 truncate table ,然后 drop table ,這樣可以避免系統(tǒng)表的較長時間鎖定。

25、避免頻繁創(chuàng)建和刪除臨時表,以減少系統(tǒng)表資源的消耗。

26、盡量避免使用游標(biāo),因為游標(biāo)的效率較差。與臨時表一樣,游標(biāo)并不是不可使用。對小型數(shù)據(jù)集使用 FAST_FORWARD 游標(biāo)通常要優(yōu)于其他逐行處理方法,尤其是在必須引用幾個表才能獲得所需的數(shù)據(jù)時。在結(jié)果集中包括“合計”的例程通常要比使用游標(biāo)執(zhí)行的速度快。

27、在所有的存儲過程和觸發(fā)器的開始處設(shè)置 SET NOCOUNT ON ,在結(jié)束時設(shè)置 SET NOCOUNT OFF 。

28、盡量避免大事務(wù)操作,提高系統(tǒng)并發(fā)能力。

29、在運行代碼中,盡量使用PreparedStatement來查詢,不要用Statement。

三、索引的選擇性與前綴索引:

既然索引可以加快查詢速度,那么是不是只要是查詢語句需要,就建上索引?答案是否定的。因為索引雖然加快了查詢速度,但索引也是有代價的:索引文件本身要消耗存儲空間,同時索引會加重插入、刪除和修改記錄時的負(fù)擔(dān),另外,MySQL在運行時也要消耗資源維護(hù)索引,因此索引并不是越多越好。一般兩種情況下不建議建索引。

第一種情況是表記錄比較少,沒必要建索引,讓查詢做全表掃描就好了。

第二種情況是索引的選擇性較低。所謂索引的選擇性,是指 不重復(fù)的索引值 與 表記錄數(shù)量 的比值:

顯然選擇性的取值范圍為(0, 1],選擇性越高的索引價值越大,這是由B+Tree的性質(zhì)決定的。

例如,employees.titles表,如果title字段經(jīng)常被單獨查詢,是否需要建索引,我們看一下它的選擇性:

SELECT count(DISTINCT(title))/count(*) AS Selectivity FROM employees.titles; +-------------+ | Selectivity | +-------------+ | 0.0000 | +-------------+

title的選擇性不足0.0001(精確值為0.00001579),所以實在沒有什么必要為其單獨建索引。

有一種與索引選擇性有關(guān)的索引優(yōu)化策略叫做前綴索引,就是用列的前綴代替整個列作為索引key,當(dāng)前綴長度合適時,可以做到既使得前綴索引的選擇性接近全列索引,同時因為索引key變短而減少了索引文件的大小和維護(hù)開銷。下面以employees.employees表為例介紹前綴索引的選擇和使用。

假設(shè)employees表只有一個索引<emp_no>,那么如果我們想按名字搜索一個人,就只能全表掃描了:

EXPLAIN SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido'; +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+ | id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+ | 1 | SIMPLE | employees | ALL | NULL | NULL | NULL | NULL | 300024 | Using where | +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+

如果頻繁按名字搜索員工,這樣顯然效率很低,因此我們可以考慮建索引。有兩種選擇,建<first_name>或<first_name, last_name>,看下兩個索引的選擇性:

SELECT count(DISTINCT(first_name))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.0042 | +-------------+ SELECT count(DISTINCT(concat(first_name, last_name)))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.9313 | +-------------+

<first_name>顯然選擇性太低,<first_name, last_name>選擇性很好,但是first_name和last_name加起來長度為30,有沒有兼顧長度和選擇性的辦法?可以考慮用first_name和last_name的前幾個字符建立索引,例如<first_name, left(last_name, 3)>,看看其選擇性:

SELECT count(DISTINCT(concat(first_name, left(last_name, 3))))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.7879 | +-------------+

選擇性還不錯,但離0.9313還是有點距離,那么把last_name前綴加到4:

SELECT count(DISTINCT(concat(first_name, left(last_name, 4))))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.9007 | +-------------+

這時選擇性已經(jīng)很理想了,而這個索引的長度只有18,比<first_name, last_name>短了接近一半,我們把這個前綴索引建上:

ALTER TABLE employees.employees ADD INDEX `first_name_last_name4` (first_name, last_name(4));

此時再執(zhí)行一遍按名字查詢,比較分析一下與建索引前的結(jié)果:

SHOW PROFILES; +----------+------------+---------------------------------------------------------------------------------+ | Query_ID | Duration | Query | +----------+------------+---------------------------------------------------------------------------------+ | 87 | 0.11941700 | SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido' | | 90 | 0.00092400 | SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido' | +----------+------------+---------------------------------------------------------------------------------+

性能的提升是顯著的,查詢速度提高了120多倍。

前綴索引兼顧索引大小和查詢速度,但是其缺點是不能用于ORDER BY和GROUP BY操作,也不能用于覆蓋索引

總結(jié)

以上是生活随笔為你收集整理的MySQL数据库:SQL优化与索引优化的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。