Using join buffer (Batched Key Access)
2019獨角獸企業重金招聘Python工程師標準>>>
Using join buffer (Batched Key Access)
表連接算法
Batched Key Access(BKA)原理
MySQL 5.6版本提供了很多性能優化的特性,其中之一是關于提高表join性能的算法 --- Batched Key Access (BKA) ,本文將結合之前寫過MRR,BNL優化特性一起來詳細介紹該算法。
對于多表join語句,當MySQL使用索引訪問第二個join表的時候,使用一個join buffer來收集第一個操作對象生成的相關列值。BKA構建好key后,批量傳給引擎層做索引查找。key是通過MRR接口提交給引擎的。這樣,MRR使得查詢更有效率。?
大致的過程如下:
BKA使用join buffer保存由join的第一個操作產生的符合條件的數據。
然后BKA算法構建key來訪問被連接的表,并批量使用MRR接口提交keys到數據庫存儲引擎去查找查找。
提交keys之后,MRR使用最佳的方式來獲取行并反饋給BKA。
BKA使用join buffer size來確定buffer的大小,buffer越大,訪問被join的表/內部表就越順序。
MRR接口有2個應用場景:
場景1:應用于傳統的基于磁盤的存儲引擎(innodb,myisam),對于這些引擎join buffer中keys是一次性提交到MRR,MRR通過key找到rowid,通過rowid來獲取數據
場景2:應用于遠程存儲引擎(NDB),來自join buffer上的部分key,從SQL NODE發送到DATA NODE,然后SQL NODE會收到通過相關關系匹配的行組合。然后使用這些行組合匹配出新行。然后在發送新key,直到發完為止。
BNL和BKA,MRR的關系
BNL和BKA都是批量的提交一部分結果集給下一個被join的表(標記為T),從而減少訪問表T的次數,那么它們有什么區別呢?
BNL和BKA的思想是類似的,詳情見:《nest-loop-join官方手冊》
第一 BNL比BKA出現的早,BKA直到5.6才出現,而BNL至少在5.1里面就存在。
第二 BNL主要用于當被join的表上無索引,
Join buffering can be used when the join is of type ALL or index (in other words, when no possible keys can be used, and a full scan is done, of either the data or index rows, respectively)
第三 BKA主要是指在被join表上有索引可以利用,那么就在行提交給被join的表之前,對這些行按照索引字段進行排序,因此減少了隨機IO,排序這才是兩者最大的區別,但是如果被join的表沒用索引呢?那就使用BNL了。
上面原理環境提到講了在BKA實現的過程中就是通過傳遞keys給MRR接口,本質上還是在MRR里面實現,下面這幅圖則展示了它們之間的關系:
如何使用
要使用BKA,必須調整系統參數optimizer_switch的值,batched_key_access設置為on,因為BKA使用了MRR,因此也要打開MRR,但是基于成本優化MRR算法不是特別準確官方文檔推薦關閉?
mrr_cost_based,將其設置為off。
set optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on'
另外多表join語句 ,被join的表/非驅動表必須索引可用。
==========END==========
轉載于:https://my.oschina.net/xinxingegeya/blog/495899
總結
以上是生活随笔為你收集整理的Using join buffer (Batched Key Access)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 1130 - Host ‘win7' i
- 下一篇: 性能调优之我见