當(dāng)前位置：首頁(yè) > 运维知识 > 数据库 >内容正文

数据库

hash算法_数据库中间件分片算法之hash

發(fā)布時(shí)間：2024/9/3 数据库 47 豆豆

生活随笔收集整理的這篇文章主要介紹了 hash算法_数据库中间件分片算法之hash 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

前言

夜深人靜的時(shí)候，打開(kāi)云音樂(lè)，點(diǎn)上一曲攀登，帶上真無(wú)線藍(lán)牙耳機(jī)，瞬間燃到爆，鍵盤打字如飛倦意全無(wú)。

分片規(guī)則

這幾天有人問(wèn)我，dble和MyCat到底有什么不同。其實(shí)dble作為MyCAT的同門，吸收了MyCat的精華，同時(shí)也相應(yīng)的做了一些減法。只支持MySQL顯得更加的純粹。所以選擇對(duì)比學(xué)習(xí)兩者我覺(jué)得挺好。

前面我們學(xué)習(xí)了schema.xml文件的配置，我們能獨(dú)立的把邏輯庫(kù)和邏輯表搭建起來(lái)，讓數(shù)據(jù)表跟隨我們的定義規(guī)則(取模)進(jìn)行分布。今天我們介紹具體的分片算法。dble相對(duì)于mycat來(lái)說(shuō)，是做了一些減法的。比如一致hash算法就沒(méi)有,而是使用了jumpstringhash代替了一致性hash。具體原因可以參考文章dble 沿用 jumpstringhash,移除 Mycat 一致性 hash 原因

hash分區(qū)算法

stringhash分區(qū)算法

enum分區(qū)算法

numberrange分區(qū)算法

patternrange分區(qū)算法

date分區(qū)算法

jumpstringhash算法

HASH分區(qū)算法

Hash分區(qū)算法是一種比較典型而且常用的算法。要使用HASH分區(qū)算法需要在rule.xml中定義兩個(gè)部分。

分區(qū)規(guī)則定義

如下所示，使用tableRule標(biāo)簽定義，name對(duì)應(yīng)的是規(guī)則的名字，而rule標(biāo)簽中的columns則對(duì)應(yīng)的分片字段，這個(gè)字段必須和表中的字段一致。algorithm則代表了執(zhí)行分片函數(shù)的名字。

分區(qū)算法定義

如下所示，使用function標(biāo)簽定義分區(qū)算法，name代表算法的名字，算法的名字要和上面的tableRule中的標(biāo)簽相對(duì)應(yīng)。class：指定分區(qū)算法實(shí)現(xiàn)類。property指定了對(duì)應(yīng)分區(qū)算法的參數(shù)。不同的算法參數(shù)不同。

<function name="rang-long"" class="com.actiontech.dble.route.function.AutoPartitionByLong"> <property name="mapFile">auto-sharding-long.txt</property> ... </function>

先看一下hash分區(qū)的定義。function的中的class屬性需要設(shè)置為hash或者com.actiontech.dble.route.function.PartitionByLong規(guī)則。然后分區(qū)算法對(duì)應(yīng)參數(shù)是partitionCount和partitionLength。

partitionCount:指定分區(qū)的區(qū)間數(shù)，具體為 C1 [+C2 + ... + Cn]
partitionLength:指定各區(qū)間長(zhǎng)度，具體區(qū)間劃分為 [0, L1), [L1, 2L1), ..., [(C1-1)L1, C1L1), [C1L1, C1L1+L2), [C1L1+L2, C1L1+2L2), ... 其中，每一個(gè)區(qū)間對(duì)應(yīng)一個(gè)數(shù)據(jù)節(jié)點(diǎn)。

測(cè)試Hash分區(qū)算法

1.在啟動(dòng)的時(shí)候，兩個(gè)數(shù)組點(diǎn)乘做運(yùn)算，得到取模數(shù)。

2.兩個(gè)數(shù)組進(jìn)行叉乘，得出物理分區(qū)表。

3.根據(jù)where條件的值來(lái)落入實(shí)際分片

select * from shareding_key = 999;

先根據(jù)分片鍵取出999，按照公式1的計(jì)算結(jié)果除取摸，然后得到的值落到2計(jì)算出來(lái)的分片中。

4.舉個(gè)簡(jiǎn)單的例子:

根據(jù)公式1：

也就是傳進(jìn)來(lái)的值需要對(duì)350取模。根據(jù)公式2：物理分區(qū)為

999對(duì)350取模，正好是299。落在[250-300]這個(gè)區(qū)間里面。也就是第4個(gè)區(qū)間。接下來(lái)我們實(shí)際來(lái)測(cè)試一下，我們?cè)趓ule.xml中設(shè)置如下：

我們通過(guò)公式2算出有5個(gè)分片。所以在schema.xml中設(shè)置table屬性如下：

5.創(chuàng)建表測(cè)試

我們先使用shell創(chuàng)建1000行數(shù)據(jù)，在創(chuàng)建表，通過(guò)load data語(yǔ)法將我們shell產(chǎn)生的文件進(jìn)行導(dǎo)入。

for i in {1..1000} do echo $i'|name'$[i]'' >>a1.txt done

這里可以看到我們查詢999這個(gè)數(shù)據(jù)，會(huì)自動(dòng)到dn4這個(gè)分片上進(jìn)行查詢。再比如我們查500,500對(duì)350取模是150，150是落在第二個(gè)分區(qū)里面的。

6.另一個(gè)例子

此時(shí)C* L=2*1000=2000,將對(duì)2000進(jìn)行取模。同時(shí)將劃分如下的分區(qū)：

注意事項(xiàng)

M不能大于2880。2880的原因是這樣的:2, 3, 4, 5, 6, 8, 9, 10, 12, 15, 16, 18, 20, 24, 30, 32, 36, 40, 45, 48, 60, 64, 72, 80, 90, 96, 120, 144, 160, 180, 192, 240, 288, 320, 360, 480, 576, 720, 960, 1440是2880的約數(shù),這樣預(yù)分片擴(kuò)容方便。

N必須要等于schema.xml中使用該分區(qū)算法的邏輯表的dataNode屬性指定的DataNode數(shù)量之和，比如我們上面這個(gè)算法是5個(gè)分區(qū)，但是如果你在邏輯表的dataNode屬性中設(shè)置分區(qū)個(gè)數(shù)小于5，dataNode="dn1,dn2,dn3,dn4"，則dble就會(huì)報(bào)錯(cuò)。 partition size : 5 > table datanode size : 4 please make sure table datanode size = function partition size

和的個(gè)數(shù)必須相等。

分區(qū)字段必須為整型字段，如果是其他類型，要求值可轉(zhuǎn)化為數(shù)字。

當(dāng)partitionLength為1時(shí)，hash分區(qū)算法退化為求模算法，M及N均為partitionCount的值。

NULL作為分片列的值的時(shí)候數(shù)據(jù)的結(jié)果恒落在0號(hào)節(jié)點(diǎn)(第一個(gè)節(jié)點(diǎn)上)，建議最好不要讓這種情況出現(xiàn)，強(qiáng)制設(shè)置分片鍵為not null。

最后：

上面都是自己整理好的！我就把資料貢獻(xiàn)出來(lái)給有需要的人！順便求一波關(guān)注。

學(xué)習(xí)我們是認(rèn)真的，拿大廠offer是勢(shì)在必得的。java(想了解更多點(diǎn)一下哦)

作者：Buddyyuan
鏈接：https://juejin.im/post/5e0a2b16518825495a1e78f6

總結(jié)

以上是生活随笔為你收集整理的hash算法_数据库中间件分片算法之hash的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： win10开机慢怎么解决_细说Win10
下一篇： truncate table 非常慢_你