當(dāng)前位置：首頁 > 运维知识 > 数据库 >内容正文

数据库

012-- mysql的分区和分表

發(fā)布時間：2023/11/29 数据库 43 豆豆

生活随笔收集整理的這篇文章主要介紹了 012-- mysql的分区和分表小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

分區(qū)

分區(qū)就是把一個數(shù)據(jù)表的文件和索引分散存儲在不同的物理文件中。

mysql支持的分區(qū)類型包括Range、List、Hash、Key，其中Range比較常用：

RANGE分區(qū)：基于屬于一個給定連續(xù)區(qū)間的列值，把多行分配給分區(qū)。

LIST分區(qū)：類似于按RANGE分區(qū)，區(qū)別在于LIST分區(qū)是基于列值匹配一個離散值集合中的某個值來進(jìn)行選擇。

HASH分區(qū)：基于用戶定義的表達(dá)式的返回值來進(jìn)行選擇的分區(qū)，該表達(dá)式使用將要插入到表中的這些行的列值進(jìn)行計算。這個函數(shù)可以包含MySQL 中有效的、產(chǎn)生非負(fù)整數(shù)值的任何表達(dá)式。

KEY分區(qū)：類似于按HASH分區(qū)，區(qū)別在于KEY分區(qū)只支持計算一列或多列，且MySQL服務(wù)器提供其自身的哈希函數(shù)。必須有一列或多列包含整數(shù)值。

案例：

建立一個user 表以id進(jìn)行分區(qū) id 小于10的在user_1分區(qū)id小于20的在user_2分區(qū)

create table user(id int not null auto_increment,username varchar(10),primary key(id) )engine = innodb charset=utf8 partition by range (id)(partition user_1 values less than (10),partition user_2 values less than (20) );

建立后添加分區(qū)：

maxvalue 表示最大值 ? 這樣大于等于20的id 都出存儲在user_3分區(qū)

alter table user add partition(partition user_3 values less than maxvalue );

刪除分區(qū)：

alter table user drop partition user_3;

如果表使用的存儲引擎是MyISAM類型，就是：

user#P#user_1.MYD,user#P#user_1.MYI和user#P#user_2.MYD,user#P#user_2.MYI

由此可見，mysql通過分區(qū)把數(shù)據(jù)保存到不同的文件里，同時索引也是分區(qū)的。相對于未分區(qū)的表來說，分區(qū)后單獨的數(shù)據(jù)庫文件索引文件的大小都明顯降低，效率則明顯的提示了。可以插入一條數(shù)據(jù)然后分析查詢語句驗證一下：

insert into user values(null,'測試');explain partitions select * from user where id =1;

可以看見僅僅在user_1分區(qū)執(zhí)行了這條查詢。

具體分區(qū)的效率是多少還需要看數(shù)據(jù)量。在分區(qū)時可以通過 DATA DIRECTORY 和?　　INDEX DIRECTORY 選項吧不同的分區(qū)放到不同的磁盤上進(jìn)一步提高系統(tǒng)的I/O吞吐量。

分區(qū)類型的選擇，通常使用Range類型，不過有些情況，比如主從結(jié)構(gòu)中，主服務(wù)器很少使用‘select’查詢，在主服務(wù)器上使用 Range類型分區(qū)通常沒有太大的意義，此時使用Hash類型分區(qū)更好例如：

partition by hash(id) partitions 10;

當(dāng)插入數(shù)據(jù)時，根據(jù)id吧數(shù)據(jù)平均散到各個分區(qū)上，由于文件小，效率高，更新操作變得更快。

在分區(qū)時使用的字段,通常情況下按時間字段分區(qū)，具體情況以需求而定。劃分應(yīng)用的方式有很多種，比如按時間或用戶，哪種用的多，就選擇哪種分區(qū)。如果使用主從結(jié)構(gòu)可能就更加靈活，有的從服務(wù)器使用時間，有的使用用戶。不過如此一來當(dāng)執(zhí)行查詢時，程序應(yīng)該負(fù)責(zé)選擇真確的服務(wù)器查詢，寫個mysql proxy腳本應(yīng)該可以透明的實現(xiàn)。

分區(qū)的限制：

1.主鍵或者唯一索引必須包含分區(qū)字段，如primary key (id,username),不過innoDB的大組建性能不好。

2.很多時候，使用分區(qū)就不要在使用主鍵了，否則可能影響性能。

3.只能通過int類型的字段或者返回int類型的表達(dá)式來分區(qū)，通常使用year或者to_days等函數(shù)（mysql 5.6 對限制開始放開了）。

4.每個表最多1024個分區(qū)，而且多分區(qū)會大量消耗內(nèi)存。

5.分區(qū)的表不支持外鍵，相關(guān)的邏輯約束需要使用程序來實現(xiàn)。

6.分區(qū)后，可能會造成索引失效，需要驗證分區(qū)可行性。

分區(qū)模式詳解：

*?Range（范圍）?– 這種模式允許DBA將數(shù)據(jù)劃分不同范圍。例如DBA可以將一個表通過年份劃分成三個分區(qū)，80年代（1980's）的數(shù)據(jù)，90年代（1990's）的數(shù)據(jù)以及任何在2000年（包括2000年）后的數(shù)據(jù)。

CREATE TABLE users ( id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, usersname VARCHAR(30) NOT NULL DEFAULT '', email VARCHAR(30) NOT NULL DEFAULT '' ) PARTITION BY RANGE (id) ( PARTITION p0 VALUES LESS THAN (3000000), PARTITION p1 VALUES LESS THAN (6000000), PARTITION p2 VALUES LESS THAN (9000000), PARTITION p3 VALUES LESS THAN MAXVALUE );

在這里，將用戶表分成4個分區(qū)，以每300萬條記錄為界限，每個分區(qū)都有自己獨立的數(shù)據(jù)、索引文件的存放目錄。

還可以將這些分區(qū)所在的物理磁盤分開完全獨立，可以提高磁盤IO吞吐量。

CREATE TABLE users ( id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, usersname VARCHAR(30) NOT NULL DEFAULT '', email VARCHAR(30) NOT NULL DEFAULT '' ) PARTITION BY RANGE (id) ( PARTITION p0 VALUES LESS THAN (3000000) DATA DIRECTORY = '/data0/data' INDEX DIRECTORY = '/data0/index', PARTITION p1 VALUES LESS THAN (6000000) DATA DIRECTORY = '/data1/data' INDEX DIRECTORY = '/data1/index', PARTITION p2 VALUES LESS THAN (9000000) DATA DIRECTORY = '/data2/data' INDEX DIRECTORY = '/data2/index', PARTITION p3 VALUES LESS THAN MAXVALUE DATA DIRECTORY = '/data3/data' INDEX DIRECTORY = '/data3/index' );

*?List（預(yù)定義列表）?– 這種模式允許系統(tǒng)通過DBA定義的列表的值所對應(yīng)的行數(shù)據(jù)進(jìn)行分割。例如：DBA根據(jù)用戶的類型進(jìn)行分區(qū)。?

CREATE TABLE user ( id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, name VARCHAR(30) NOT NULL DEFAULT '' ,user_type int not null ) PARTITION BY LIST (user_type ) ( PARTITION p0 VALUES IN (0,4,8,12) , PARTITION p1 VALUES IN (1,5,9,13) , PARTITION p2 VALUES IN (2,6,10,14), PARTITION p3 VALUES IN (3,7,11,15) );

分成4個區(qū),同樣可以將分區(qū)設(shè)置的獨立的磁盤中。

*?Key（鍵值）?– 上面Hash模式的一種延伸，這里的Hash Key是MySQL系統(tǒng)產(chǎn)生的。?

CREATE TABLE user ( id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, name VARCHAR(30) NOT NULL DEFAULT '', email VARCHAR(30) NOT NULL DEFAULT '' ) PARTITION BY KEY (id) PARTITIONS 4 ( PARTITION p0, PARTITION p1, PARTITION p2, PARTITION p3 );

*?Hash（哈希）?– 這中模式允許DBA通過對表的一個或多個列的Hash Key進(jìn)行計算，最后通過這個Hash碼不同數(shù)值對應(yīng)的數(shù)據(jù)區(qū)域進(jìn)行分區(qū)，。例如DBA可以建立一個對表主鍵進(jìn)行分區(qū)的表。?

CREATE TABLE user ( id INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, username VARCHAR(30) NOT NULL DEFAULT '', email VARCHAR(30) NOT NULL DEFAULT '' ) PARTITION BY HASH (id) PARTITIONS 4 ( PARTITION p0 , PARTITION p1, PARTITION p2,PARTITION p3 );

分成4個區(qū),同樣可以將分區(qū)設(shè)置的獨立的磁盤中。

= 分區(qū)管理 =

刪除分區(qū)

ALERT TABLE users DROP PARTITION p0;

重建分區(qū)

? RANGE 分區(qū)重建

ALTER TABLE users REORGANIZE PARTITION p0,p1 INTO (PARTITION p0 VALUES LESS THAN (6000000));

將原來的 p0,p1 分區(qū)合并起來，放到新的 p0 分區(qū)中。

LIST 分區(qū)重建

ALTER TABLE users REORGANIZE PARTITION p0,p1 INTO (PARTITION p0 VALUES IN(0,1,4,5,8,9,12,13));

將原來的 p0,p1 分區(qū)合并起來，放到新的 p0 分區(qū)中。

HASH/KEY 分區(qū)重建

ALTER TABLE users REORGANIZE PARTITION COALESCE PARTITION 2;

用 REORGANIZE 方式重建分區(qū)的數(shù)量變成2，在這里數(shù)量只能減少不能增加。想要增加可以用 ADD PARTITION 方法。

新增分區(qū)

新增 RANGE 分區(qū)??

alter table user add partition(partition user_3 values less than maxvalue);

新增 LIST 分區(qū)?

ALTER TABLE category ADD PARTITION (PARTITION p4 VALUES IN (16,17,18,19));

新增 HASH/KEY 分區(qū)

ALTER TABLE users ADD PARTITION PARTITIONS 8;

將分區(qū)總數(shù)擴(kuò)展到8個。

給已有的表加上分區(qū)

alter table results partition by RANGE (month(ttime)) (PARTITION p0 VALUES LESS THAN (1), PARTITION p1 VALUES LESS THAN (2) , PARTITION p2 VALUES LESS THAN (3) , PARTITION p3 VALUES LESS THAN (4) , PARTITION p4 VALUES LESS THAN (5) , PARTITION p5 VALUES LESS THAN (6) , PARTITION p6 VALUES LESS THAN (7) , PARTITION p7 VALUES LESS THAN (8) , PARTITION p8 VALUES LESS THAN (9) , PARTITION p9 VALUES LESS THAN (10) , PARTITION p10 VALUES LESS THAN (11), PARTITION p11 VALUES LESS THAN (12), PARTITION P12 VALUES LESS THAN (13) );

分表

分表和分區(qū)類似，區(qū)別是，分區(qū)是把一個邏輯表文件分成幾個物理文件后進(jìn)行存儲，而分表則是把原先的一個表分成幾個表。進(jìn)行分表查詢時可以通過union或者視圖。

分表又分垂直分割和水平分割，其中水平分分割最為常用。水平分割通常是指切分到另外一個數(shù)據(jù)庫或表中。例如對于一個會員表，按對3的模進(jìn)行分割:

table = id%3

如果id%3 = 0 則將用戶數(shù)據(jù)放入到user_0表中，如id%3=1就放入user_1表中，依次類推。

在這里有個問題，這個uid應(yīng)該是所有會員按序增長的，可他是怎么得到的呢？使用auto_increment是不行的，這樣就用到序列了。

對于一些流量統(tǒng)計系統(tǒng)，其數(shù)據(jù)量比較大，并且對過往數(shù)據(jù)的關(guān)注度不高，這時按年、月、日進(jìn)行分表，將每日統(tǒng)計信息放到一個以日期命名的表中；或者按照增量進(jìn)行分表，如每個表100萬數(shù)據(jù)，超過100萬就放入第二個表。還可以按Hash進(jìn)行分表，但是按日期和取模余數(shù)分表最為常見，也容易擴(kuò)展。

分表后可能會遇到新的問題，那就是查詢，分頁和統(tǒng)計。通用的方法是在程序中進(jìn)行處理，輔助視圖。

使用分表案例：

案例1：

對會員數(shù)據(jù)對5取模，放在5個表中，如何查詢會員數(shù)據(jù)：

1.已知id查詢會員數(shù)據(jù)，代碼如下：

<?php //查詢單個會員數(shù)據(jù) $customer_table = 'customer'.$id%5; $sql = 'select * from '.$customer_table.' where customer_id = '.$id; //查詢?nèi)繒T數(shù)據(jù) $sql = ''; $tbale = ['customer0','customer1','customer2','customer3','customer4']; foreach($table as $v){ $sql .='select * from '.$v.' union'; } $sql = substr($sql,0,-5);?>

這樣就可以查詢某一個會員的數(shù)據(jù)或者全部會員的數(shù)據(jù)了。同理，分頁的話在這個大集合中使用limit 就可以了。但是這樣做又會有一個疑問，把所有的表連起來查詢和部分表沒有什么區(qū)別，其實在實際的應(yīng)用中，不可能查看所有的會員資料，一次查看20個然后分頁。完全沒有必要做union，僅查詢一個表就可以了，唯一需要考慮的是在分頁零界點時的銜接。其實，這個銜接是否那么重要？即使偶爾出現(xiàn)幾條數(shù)據(jù)的差異，也不會對業(yè)務(wù)有任何的影響。

2.和其它表進(jìn)行關(guān)聯(lián)和1類似。

3.根據(jù)會員姓名搜索用戶信息。在這種需求下，需要搜索所有的表，并對結(jié)果進(jìn)行匯總。雖然這樣做產(chǎn)生了多次的查詢，但并不代表效率低。好的sql語句執(zhí)行10次也比差的sql語句執(zhí)行一次快。

案例2：

在一個流量監(jiān)控系統(tǒng)中，由于網(wǎng)絡(luò)流量巨大，統(tǒng)計數(shù)據(jù)很龐大，需要按天分表。先要得到任意日，周，月的數(shù)據(jù)。

1.需要任意一天的數(shù)據(jù)。直接查詢當(dāng)天的數(shù)據(jù)表即可。

2.需要幾天的數(shù)據(jù)。分愛查詢這幾天的數(shù)據(jù)，然后進(jìn)行匯總。

3.需要查詢一周的數(shù)據(jù)。對一周的數(shù)據(jù)定期匯總到一個week表，從這個表里面查詢。這個匯總過程可以由一個外部程序完成，也可以由定期的腳本完成。

4.查詢一個月的數(shù)據(jù)。匯總本月所有的數(shù)據(jù)到month表，在此表查詢。

5.查詢5個月內(nèi)的詳細(xì)數(shù)據(jù)。不支持。僅支持最多3個月的詳細(xì)數(shù)據(jù)。數(shù)據(jù)沒3個月已歸檔一次。在大數(shù)據(jù)的處理中，必須做出一些犧牲。對于超出3個月的數(shù)據(jù)，僅提供統(tǒng)計數(shù)據(jù)，詳細(xì)數(shù)據(jù)需要查看歸檔。90天或者180天，給數(shù)據(jù)保存設(shè)個界限，也是大部分這類系統(tǒng)的常規(guī)做法，超出90天的數(shù)據(jù)就不再提供數(shù)據(jù)詳單了。比如，移動的通話記錄最多保存半年，即180天，超過這個范圍的數(shù)據(jù)不在提供查詢。如果你實在需要，可能就要聯(lián)系移動的工程師了。

分表前應(yīng)該盡量按照實際業(yè)務(wù)來分表，參考依據(jù)就是哪些字段在查詢中起到作用，那就這些字段來分表，并且需要在分表前就估算好規(guī)模，也就是先確定好規(guī)則在分表。

對于分表后的操作，依然是聯(lián)合查詢，視圖等基本操作，或者使用merge引擎合并數(shù)據(jù)并在此表中查詢。復(fù)雜一些操作需要借助存儲過程來完成，借助外部工具實現(xiàn)對分表的管理。

對于比較龐大的數(shù)據(jù)，不論是否進(jìn)行分表，都必須考慮功能和效率的平衡性，并在功能上做出讓步。我們不能事事遷就用戶，而應(yīng)該對某些影響效率的功能做出限制。例如移動公司的180天限制、論壇禁止對老帖進(jìn)行回復(fù)等。

轉(zhuǎn)載于:https://www.cnblogs.com/yxllovetm/p/10123731.html

總結(jié)

以上是生活随笔為你收集整理的012-- mysql的分区和分表的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

MySQL
分区

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

数据库

012-- mysql的分区和分表

分區(qū)

總結(jié)