當(dāng)前位置：首頁(yè) >

mysql explain 为空_车祸现场！我的MySQL千万级数据表选错索引了！

發(fā)布時(shí)間：2023/12/3 54 豆豆

生活随笔收集整理的這篇文章主要介紹了 mysql explain 为空_车祸现场！我的MySQL千万级数据表选错索引了！小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

最近在線(xiàn)上環(huán)境遇到了一次SQL慢查詢(xún)引發(fā)的數(shù)據(jù)庫(kù)故障，影響線(xiàn)上業(yè)務(wù)。經(jīng)過(guò)排查后，確定原因是：SQL在執(zhí)行時(shí)，MySQL優(yōu)化器選擇了錯(cuò)誤的索引(不應(yīng)該說(shuō)是“錯(cuò)誤”，而是選擇了實(shí)際執(zhí)行耗時(shí)更長(zhǎng)的索引)。

排查過(guò)程中，查閱了許多資料，也學(xué)習(xí)了下MySQL優(yōu)化器選擇索引的基本準(zhǔn)則，在本文中進(jìn)行解決問(wèn)題思路的分享。本人MySQL了解深度有限，如有錯(cuò)誤歡迎在評(píng)論區(qū)理性討論和指正。

在這次事故中也能充分看出深入了解MySQL運(yùn)行原理的重要性，這是遇到問(wèn)題時(shí)能否獨(dú)立解決問(wèn)題的關(guān)鍵。?

試想一個(gè)月黑風(fēng)高的夜晚，公司線(xiàn)上突然掛了，而你的同事們都不在線(xiàn)，就你一個(gè)人有條件解決問(wèn)題，這時(shí)候如果被工程師的基本功把你卡住了，就問(wèn)你尷不尷尬...

本文的主要內(nèi)容：

故障描述；
問(wèn)題原因排查；
MySQL索引選擇原理；
解決方案；
思考與總結(jié)。

故障描述

在7月24日11點(diǎn)線(xiàn)上某數(shù)據(jù)庫(kù)突然收到大量告警，慢查詢(xún)數(shù)超標(biāo)，并且引發(fā)了連接數(shù)暴增，導(dǎo)致數(shù)據(jù)庫(kù)響應(yīng)緩慢，影響業(yè)務(wù)。

看圖表慢查詢(xún)?cè)诟叻暹_(dá)到了每分鐘14w次，在平時(shí)正常情況下慢查詢(xún)數(shù)僅在兩位數(shù)以下，如下圖：

趕緊查看慢SQL記錄，發(fā)現(xiàn)都是同一類(lèi)語(yǔ)句導(dǎo)致的慢查詢(xún)(隱私數(shù)據(jù)例如表名，我已經(jīng)隱去)：

select

? *

from

? sample_table

where

? ? 1 = 1

? ? and (city_id = 565)

? ? and (type = 13)

order by

? id desc

limit

? 0, 1

看起來(lái)語(yǔ)句很簡(jiǎn)單，沒(méi)什么特別的，但是每個(gè)執(zhí)行的查詢(xún)時(shí)間達(dá)到了驚人的44s。

簡(jiǎn)直聳人聽(tīng)聞，這已經(jīng)不是“慢”能形容的了...

接下來(lái)查看表數(shù)據(jù)信息，如下圖：

可以看到表數(shù)據(jù)量較大，預(yù)估行數(shù)在83683240，也就是8000w左右，千萬(wàn)數(shù)據(jù)量的表。

大致情況就是這樣，下面進(jìn)入排查問(wèn)題的環(huán)節(jié)。

問(wèn)題原因排查

首先當(dāng)然要懷疑會(huì)不會(huì)該語(yǔ)句沒(méi)走索引，查看建表DML中的索引：

KEY `idx_1` (`city_id`,`type`,`rank`),

KEY `idx_log_dt_city_id_rank` (`log_dt`,`city_id`,`rank`),

KEY `idx_city_id_type` (`city_id`,`type`)

請(qǐng)忽略idx_1和idx_city_id_type兩個(gè)索引的重復(fù)，這都是歷史遺留問(wèn)題了。

可以看到是有idx_city_id_type和idx_1索引的，我們的查詢(xún)條件是city_id和type，這兩個(gè)索引都是能走到的。

但是，我們的查詢(xún)條件真的只要考慮city_id和type嗎？(機(jī)智的小伙伴應(yīng)該注意到問(wèn)題所在了，先往下講，留給大家思考)

既然有索引，接下來(lái)就該看該語(yǔ)句實(shí)際有沒(méi)有走到索引了，MySQL提供了Explain可以分析SQL語(yǔ)句。Explain用來(lái)分析SELECT查詢(xún)語(yǔ)句。

Explain比較重要的字段有：

select_type : 查詢(xún)類(lèi)型，有簡(jiǎn)單查詢(xún)、聯(lián)合查詢(xún)、子查詢(xún)等；
key : 使用的索引；
rows : 預(yù)計(jì)需要掃描的行數(shù)。

更多詳細(xì)Explain介紹可以參考：MySQL性能優(yōu)化神器Explain使用分析。

我們使用Explain分析該語(yǔ)句：

select * from sample_table where city_id = 565 and type = 13 order by id desc limit 0,1

得到結(jié)果：

可以看出，雖然possiblekey有我們的索引，但是最后走了主鍵索引。而表是千萬(wàn)級(jí)別，并且該查詢(xún)條件最后實(shí)際是返回的空數(shù)據(jù)，也就是MySQL在主鍵索引上實(shí)際檢索時(shí)間很長(zhǎng)，導(dǎo)致了慢查詢(xún)。

我們可以使用force index(idx_city_id_type)讓該語(yǔ)句選擇我們?cè)O(shè)置的聯(lián)合索引：

select * from sample_table force index(idx_city_id_type)? where ( ( (1 = 1) and (city_id = 565) ) and (type = 13) ) order by id desc limit 0, 1

這次明顯執(zhí)行得飛快，分析語(yǔ)句：

實(shí)際執(zhí)行時(shí)間0.00175714s，走了聯(lián)合索引后，不再是慢查詢(xún)了。

問(wèn)題找到了，總結(jié)下來(lái)就是：

MySQL優(yōu)化器認(rèn)為在limit 1的情況下，走主鍵索引能夠更快的找到那一條數(shù)據(jù)，并且如果走聯(lián)合索引需要掃描索引后進(jìn)行排序，而主鍵索引天生有序，所以?xún)?yōu)化器綜合考慮，走了主鍵索引。實(shí)際上，MySQL遍歷了8000w條數(shù)據(jù)也沒(méi)找到那個(gè)天選之人(符合條件的數(shù)據(jù))，所以浪費(fèi)了很多時(shí)間。

MySQL索引選擇原理1、優(yōu)化器索引選擇的準(zhǔn)則

MySQL一條語(yǔ)句的執(zhí)行流程大致如下圖，而查詢(xún)優(yōu)化器則是選擇索引的地方：

引用參考文獻(xiàn)一段解釋：

首先要知道，選擇索引是MySQL優(yōu)化器的工作。

而優(yōu)化器選擇索引的目的，是找到一個(gè)最優(yōu)的執(zhí)行方案，并用最小的代價(jià)去執(zhí)行語(yǔ)句。在數(shù)據(jù)庫(kù)里面，掃描行數(shù)是影響執(zhí)行代價(jià)的因素之一。掃描的行數(shù)越少，意味著訪(fǎng)問(wèn)磁盤(pán)數(shù)據(jù)的次數(shù)越少，消耗的CPU資源越少。

當(dāng)然，掃描行數(shù)并不是唯一的判斷標(biāo)準(zhǔn)，優(yōu)化器還會(huì)結(jié)合是否使用臨時(shí)表、是否排序等因素進(jìn)行綜合判斷。

總結(jié)下來(lái)，優(yōu)化器選擇有許多考慮的因素：掃描行數(shù)、是否使用臨時(shí)表、是否排序等等。

我們回頭看剛才的兩個(gè)explain截圖：

走了主鍵索引的查詢(xún)語(yǔ)句，rows預(yù)估行數(shù)1833，而強(qiáng)制走聯(lián)合索引行數(shù)是45640，并且Extra信息中，顯示需要Using filesort進(jìn)行額外的排序。

所以在不加強(qiáng)制索引的情況下，優(yōu)化器選擇了主鍵索引，因?yàn)樗X(jué)得主鍵索引掃描行數(shù)少，而且不需要額外的排序操作，主鍵索引天生有序。

2、rows是怎么預(yù)估出來(lái)的

同學(xué)們就要問(wèn)了，為什么rows只有1833，明明實(shí)際掃描了整個(gè)主鍵索引啊,行數(shù)遠(yuǎn)遠(yuǎn)不止幾千行。實(shí)際上explain的rows是MySQL預(yù)估的行數(shù)，是根據(jù)查詢(xún)條件、索引和limit綜合考慮出來(lái)的預(yù)估行數(shù)。

MySQL是怎樣得到索引的基數(shù)的呢？這里，我給你簡(jiǎn)單介紹一下MySQL采樣統(tǒng)計(jì)的方法。

為什么要采樣統(tǒng)計(jì)呢？因?yàn)榘颜麖埍砣〕鰜?lái)一行行統(tǒng)計(jì)，雖然可以得到精確的結(jié)果，但是代價(jià)太高了，所以只能選擇“采樣統(tǒng)計(jì)”。

采樣統(tǒng)計(jì)的時(shí)候，InnoDB默認(rèn)會(huì)選擇N個(gè)數(shù)據(jù)頁(yè)，統(tǒng)計(jì)這些頁(yè)面上的不同值，得到一個(gè)平均值，然后乘以這個(gè)索引的頁(yè)面數(shù)，就得到了這個(gè)索引的基數(shù)。

而數(shù)據(jù)表是會(huì)持續(xù)更新的，索引統(tǒng)計(jì)信息也不會(huì)固定不變。所以，當(dāng)變更的數(shù)據(jù)行數(shù)超過(guò)1/M的時(shí)候，會(huì)自動(dòng)觸發(fā)重新做一次索引統(tǒng)計(jì)。

在MySQL中，有兩種存儲(chǔ)索引統(tǒng)計(jì)的方式，可以通過(guò)設(shè)置參數(shù)innodb_stats_persistent的值來(lái)選擇：

設(shè)置為on的時(shí)候，表示統(tǒng)計(jì)信息會(huì)持久化存儲(chǔ)。這時(shí)，默認(rèn)的N是20，M是10。

設(shè)置為off的時(shí)候，表示統(tǒng)計(jì)信息只存儲(chǔ)在內(nèi)存中。這時(shí)，默認(rèn)的N是8，M是16。

由于是采樣統(tǒng)計(jì)，所以不管N是20還是8，這個(gè)基數(shù)都是很容易不準(zhǔn)的。

我們可以使用analyze table t命令，可以用來(lái)重新統(tǒng)計(jì)索引信息。但是這條命令生產(chǎn)環(huán)境需要聯(lián)系DBA，所以我就不做實(shí)驗(yàn)了，大家可以自行實(shí)驗(yàn)。

3、索引要考慮order by的字段

為什么這么說(shuō)？因?yàn)槿绻疫@個(gè)表中的索引是city_id,type和id的聯(lián)合索引，那優(yōu)化器就會(huì)走這個(gè)聯(lián)合索引，因?yàn)樗饕呀?jīng)做好了排序。

4、更改limit大小能解決問(wèn)題？

把limit數(shù)量調(diào)大會(huì)影響預(yù)估行數(shù)rows，進(jìn)而影響優(yōu)化器索引的選擇嗎？

答案是會(huì)。

我們執(zhí)行l(wèi)imit 10：

select * from sample_table where city_id = 565 and type = 13 order by id desc limit 0,10

圖中rows變?yōu)榱?8211，增長(zhǎng)了10倍。如果使用limit 100，會(huì)發(fā)生什么？

優(yōu)化器選擇了聯(lián)合索引。初步估計(jì)是rows還會(huì)翻倍，所以?xún)?yōu)化器放棄了主鍵索引。寧愿用聯(lián)合索引后排序，也不愿意用主鍵索引了。

5、為何突然出現(xiàn)異常慢查詢(xún)

Q：這個(gè)查詢(xún)語(yǔ)句已經(jīng)在線(xiàn)上穩(wěn)定運(yùn)行了非常長(zhǎng)的時(shí)間，為何這次突然出現(xiàn)了慢查詢(xún)？

A：以前的語(yǔ)句查詢(xún)條件返回結(jié)果都不為空，limit1很快就能找到那條數(shù)據(jù)，返回結(jié)果。而這次代碼中查詢(xún)條件實(shí)際結(jié)果為空，導(dǎo)致了掃描了全部的主鍵索引。

解決方案

知道了MySQL為何選擇這個(gè)索引的原因后，我們就可以根據(jù)上面的思路來(lái)列舉出解決辦法了。

主要有兩個(gè)大方向：

強(qiáng)制指定索引；
干涉優(yōu)化器選擇。

1、強(qiáng)制選擇索引：force index

就像上面我最開(kāi)始的操作那樣，我們直接使用force index，讓語(yǔ)句走我們想要走的索引。

select * from sample_table force index(idx_city_id_type)? where ( ( (1 = 1) and (city_id = 565) ) and (type = 13) ) order by id desc limit 0, 1

這樣做的優(yōu)點(diǎn)是見(jiàn)效快，問(wèn)題馬上就能解決。

缺點(diǎn)也很明顯：

高耦合，這種語(yǔ)句寫(xiě)在代碼里，會(huì)變得難以維護(hù)，如果索引名變化了，或者沒(méi)有這個(gè)索引了，代碼就要反復(fù)修改。屬于硬編碼；
很多代碼用框架封裝了SQL，force index()并不容易加進(jìn)去。

我們換一種辦法，去引導(dǎo)優(yōu)化器選擇聯(lián)合索引。

2、干涉優(yōu)化器選擇：增大limit

通過(guò)增大limit，我們可以讓預(yù)估掃描行數(shù)快速增加，比如改成下面的limit 0, 1000：

SELECT * FROM sample_table where city_id = 565 and type = 13 order by id desc LIMIT 0,1000

這樣就會(huì)走上聯(lián)合索引，然后排序，但是這樣強(qiáng)行增長(zhǎng)limit，其實(shí)總有種面向黑盒調(diào)參的感覺(jué)。我們還有更優(yōu)美的解決方案嗎？

3、干涉優(yōu)化器選擇：增加包含order by id字段的聯(lián)合索引

我們這句慢查詢(xún)使用的是order by id，但是我們卻沒(méi)有在聯(lián)合索引中加入id字段，導(dǎo)致了優(yōu)化器認(rèn)為聯(lián)合索引后還要排序，干脆就不太想走這個(gè)聯(lián)合索引了。

我們可以新建city_id,type和id的聯(lián)合索引，來(lái)解決這個(gè)問(wèn)題。

這樣也有一定的弊端，比如我這個(gè)表到了8000w數(shù)據(jù)，建立索引非常耗時(shí)，而且通常索引就有3.4個(gè)g，如果無(wú)限制的用索引解決問(wèn)題，可能會(huì)帶來(lái)新的問(wèn)題。表中的索引不宜過(guò)多。

4、干涉優(yōu)化器選擇：寫(xiě)成子查詢(xún)

還有什么辦法？我們可以用子查詢(xún)，在子查詢(xún)里先走city_id和type的聯(lián)合索引，得到結(jié)果集后在limit1選出第一條。

但是子查詢(xún)使用有風(fēng)險(xiǎn)，一般DBA也不建議使用子查詢(xún)，會(huì)建議大家在代碼邏輯中完成復(fù)雜的查詢(xún)。當(dāng)然我們這句并不復(fù)雜啦~

Select * From sample_table Where id in (Select id From `newhome_db`.`af_hot_price_region` where (city_id = 565 and type = 13)) limit 0, 1

5、還有很多解決辦法

SQL優(yōu)化是個(gè)很大的工程，我們還有非常多的辦法能夠解決這句慢查詢(xún)問(wèn)題，這里就不一一展開(kāi)了。

總結(jié)

本文帶大家回顧了一次MySQL優(yōu)化器選錯(cuò)索引導(dǎo)致的線(xiàn)上慢查詢(xún)事故，可以看出MySQL優(yōu)化器對(duì)于索引的選擇并不單單依靠某一個(gè)標(biāo)準(zhǔn)，而是一個(gè)綜合選擇的結(jié)果。

我自己也對(duì)這方面了解不深入，還需要多多學(xué)習(xí)，爭(zhēng)取能夠好好的做一個(gè)索引選擇的總結(jié)(挖坑)。不說(shuō)了，拿起巨厚的《高性能MySQL》，開(kāi)始...

壓住我的泡面...

最后做個(gè)文章總結(jié)：

該慢查詢(xún)語(yǔ)句中使用order by id導(dǎo)致優(yōu)化器在主鍵索引和city_id和type的聯(lián)合索引中有所取舍，最終導(dǎo)致選擇了更慢的索引；
可以通過(guò)強(qiáng)制指定索引，建立包含id的聯(lián)合索引，增大limit等方式解決問(wèn)題；
平時(shí)開(kāi)發(fā)時(shí)，尤其是對(duì)于特大數(shù)據(jù)量的表，要注意SQL語(yǔ)句的規(guī)范和索引的建立，避免事故的發(fā)生。

>>>>

參考資料

《高性能MySQL》
MySQL優(yōu)化器 limit影響的case：https://www.cnblogs.com/xpchild/p/3878417.html
MySQL中走與不走索引的情況匯集(待全量實(shí)驗(yàn))：https://www.cnblogs.com/gxyandwmm/p/13363100.html
MySQL ORDER BY主鍵id加LIMIT限制走錯(cuò)索引：https://www.jianshu.com/p/caf5818eca81
【業(yè)務(wù)學(xué)習(xí)】關(guān)于MySQL order by limit 走錯(cuò)索引的探討：https://segmentfault.com/a/1190000020399424
MySQL為什么有時(shí)候會(huì)選錯(cuò)索引？：https://www.cnblogs.com/a-phper/p/10313888.html

作者丨蠻三刀把刀來(lái)源丨后端技術(shù)漫談(ID：Rude3Knife)dbaplus社群歡迎廣大技術(shù)人員投稿，投稿郵箱：editor@dbaplus.cn

云時(shí)代下數(shù)據(jù)庫(kù)將如何革新與創(chuàng)變？金融行業(yè)核心數(shù)據(jù)庫(kù)遷移與建設(shè)如何安全平穩(wěn)展開(kāi)？開(kāi)源技術(shù)如何在實(shí)際業(yè)務(wù)場(chǎng)景中發(fā)揮實(shí)力？10月30日，DAMS中國(guó)數(shù)據(jù)智能管理峰會(huì)將在上海舉辦，專(zhuān)設(shè)【數(shù)據(jù)庫(kù)分場(chǎng)】，部分議題如下：

《從自研演進(jìn)看分布式數(shù)據(jù)庫(kù)》中國(guó)銀聯(lián) 云計(jì)算中心團(tuán)隊(duì)主管周家晶
《開(kāi)源數(shù)據(jù)庫(kù)MySQL在民生銀行的應(yīng)用實(shí)踐》民生銀行項(xiàng)目經(jīng)理徐春陽(yáng)
《TDSQL在金融行業(yè)數(shù)據(jù)庫(kù)上云實(shí)戰(zhàn)》騰訊云高級(jí)經(jīng)理陳琢
《如何構(gòu)建數(shù)據(jù)庫(kù)容器化PaaS》愛(ài)可生資深方案架構(gòu)師徐陽(yáng)

立即掃碼享受早鳥(niǎo)價(jià)，在數(shù)據(jù)庫(kù)變遷中站穩(wěn)腳跟！

總結(jié)

以上是生活随笔為你收集整理的mysql explain 为空_车祸现场！我的MySQL千万级数据表选错索引了！的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：工行怎么关闭网银？
下一篇： mongodb如何写入图片_CTO之瞳-

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

mysql explain 为空_车祸现场！我的MySQL千万级数据表选错索引了！

總結(jié)