mysql 大数据 join_MySQL JOIN算法原理
MySQL的JOIN相關(guān)操作,是通過“嵌套循環(huán)連接算法,NLJ”或者該算法的優(yōu)化變體“塊嵌套循環(huán)連接算法,BNLJ”來實現(xiàn)的。
##### 嵌套循環(huán)連接算法
兩個表join時,可以簡單理解為兩層for循環(huán),外層循環(huán)一般稱作驅(qū)動表,循壞內(nèi)層稱作被驅(qū)動表。每次取出驅(qū)動表中一條數(shù)據(jù),然后通過內(nèi)循環(huán)遍歷被驅(qū)動表,并在循環(huán)體中判斷驅(qū)動表記錄與被驅(qū)動表記錄是否匹配。直到驅(qū)動表的全部記錄都處理完畢為止。這就是嵌套循環(huán)連接算法的基本思想,偽代碼如下。
for each row in t1 {
for each row in t2 {
if row satisfies join conditions, send to client
}
}
塊嵌套循環(huán)連接算法
大致思想就是建立一個緩存區(qū),一次從驅(qū)動表中取多條記錄,然后掃描被驅(qū)動表,被驅(qū)動表的每一條記錄都嘗試與緩沖區(qū)中的多條記錄匹配,如果匹配則連接并加入結(jié)果集。緩沖區(qū)越大,驅(qū)動表一次取出的記錄就越多。這個算法的優(yōu)化思路就是減少內(nèi)循環(huán)的次數(shù)從而提高表連接效率。偽代碼如下。
for each row in t1 {
store used columns from t1 in join buffer
if buffer is full {
for each row in t2 {
if row satisfies join conditions, send to client
}
}
empty join buffer
}
}
總結(jié)
以上是生活随笔為你收集整理的mysql 大数据 join_MySQL JOIN算法原理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 非常可爱的日系二次元昵称118个
- 下一篇: mysql ondelete_MySQL