當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

mysql 大数据 join_MySQL JOIN算法原理

發(fā)布時間：2023/12/2 数据库 35 豆豆

生活随笔收集整理的這篇文章主要介紹了 mysql 大数据 join_MySQL JOIN算法原理小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

MySQL的JOIN相關(guān)操作，是通過“嵌套循環(huán)連接算法，NLJ”或者該算法的優(yōu)化變體“塊嵌套循環(huán)連接算法，BNLJ”來實現(xiàn)的。

##### 嵌套循環(huán)連接算法

兩個表join時，可以簡單理解為兩層for循環(huán)，外層循環(huán)一般稱作驅(qū)動表，循壞內(nèi)層稱作被驅(qū)動表。每次取出驅(qū)動表中一條數(shù)據(jù)，然后通過內(nèi)循環(huán)遍歷被驅(qū)動表，并在循環(huán)體中判斷驅(qū)動表記錄與被驅(qū)動表記錄是否匹配。直到驅(qū)動表的全部記錄都處理完畢為止。這就是嵌套循環(huán)連接算法的基本思想，偽代碼如下。

for each row in t1 {

for each row in t2 {

if row satisfies join conditions, send to client

}

塊嵌套循環(huán)連接算法

大致思想就是建立一個緩存區(qū)，一次從驅(qū)動表中取多條記錄，然后掃描被驅(qū)動表，被驅(qū)動表的每一條記錄都嘗試與緩沖區(qū)中的多條記錄匹配，如果匹配則連接并加入結(jié)果集。緩沖區(qū)越大，驅(qū)動表一次取出的記錄就越多。這個算法的優(yōu)化思路就是減少內(nèi)循環(huán)的次數(shù)從而提高表連接效率。偽代碼如下。

for each row in t1 {

store used columns from t1 in join buffer

if buffer is full {

for each row in t2 {

if row satisfies join conditions, send to client

}

empty join buffer

}

總結(jié)

以上是生活随笔為你收集整理的mysql 大数据 join_MySQL JOIN算法原理的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：非常可爱的日系二次元昵称118个
下一篇： mysql ondelete_MySQL