MySQL数据库:分区Partition
一、分區(qū):
分區(qū)就是將表的數據按照特定規(guī)則存放在不同的區(qū)域,也就是將表的數據文件分割成多個小塊,在查詢數據的時候,只要知道數據數據存儲在哪些區(qū)域,然后直接在對應的區(qū)域進行查詢,不需要對表數據進行全部的查詢,提高查詢的性能。同時,如果表數據特別大,一個磁盤磁盤放不下時,我們也可以將數據分配到不同的磁盤去,解決存儲瓶頸的問題,利用多個磁盤,也能夠提高磁盤的IO效率,提高數據庫的性能。常見的分區(qū)類型有:Range分區(qū)、List分區(qū)、Hash分區(qū)、Key分區(qū):
- (1)Range分區(qū):按照連續(xù)的區(qū)間范圍進行分區(qū)
- (2)List分區(qū):按照給定的集合中的值進行選擇分區(qū)。
- (3)Hash分區(qū):基于用戶定義的表達式的返回值進行分區(qū),該表達式使用將要插入到表中的這些行的列值進行計算。這個函數可以包含MySQL中有效的、產生非負整數值的任何表達式。
- (4)Key分區(qū):類似于按照HASH分區(qū),區(qū)別在于Key分區(qū)只支持計算一列或多列,且key分區(qū)的哈希函數是由 MySQL 服務器提供。
1、表分區(qū)的優(yōu)點:
(1)可伸縮性:
- 將分區(qū)分在不同磁盤,可以解決單磁盤容量瓶頸問題,存儲更多的數據,也能解決單磁盤的IO瓶頸問題。
(2)提升數據庫的性能:
- 減少數據庫檢索時需要遍歷的數據量,在查詢時只需要在數據對應的分區(qū)進行查詢。
- 避免Innodb的單個索引的互斥訪問限制
- 對于聚合函數,例如sum()和count(),可以在每個分區(qū)進行并行處理,最終只需要統(tǒng)計所有分區(qū)得到的結果
(3)方便對數據進行運維管理:
- 方便管理,對于失去保存意義的數據,通過刪除對應的分區(qū),達到快速刪除的作用。比如刪除某一時間的歷史數據,直接執(zhí)行truncate,或者直接drop整個分區(qū),這比detele刪除效率更高;
- 在某些場景下,單個分區(qū)表的備份很恢復會更有效率。
2、表分區(qū)的缺陷:
(1)分區(qū)字段必須放主鍵或者唯一索引中;
(2)每個表最大分區(qū)數為1024;
3、業(yè)務場景舉例:
(1)項目需要動態(tài)新建、刪除分區(qū)。比如新聞表,按照時月份進行分區(qū),同時為了防止新聞表過大,只保留最近6個月的分區(qū),同時預建后面3個月的分區(qū),這個刪除、預建分區(qū)的過程就是分區(qū)表的動態(tài)管理。
(2)歷史數據或不常訪問的數據占很大部分,最新或熱點數據占的比例不是很大,這時也可以進行表分區(qū)。
4、MySQL分區(qū)類型:
根據所使用的不同分區(qū)規(guī)則,可以分成幾大分區(qū)類型:??
| 序號 | 分區(qū)類型 | 說明 | 使用頻率 |
| 1 | RANGE 分區(qū) | 按照連續(xù)的區(qū)間范圍進行分區(qū) | 較多 |
| 2 | LIST 分區(qū) | 按照給定的集合中的值進行選擇分區(qū) | 一般 |
| 3 | HASH 分區(qū) | 基于用戶定義的表達式的返回值來進行選擇的分區(qū),該表達式使用將要插入到表中的這些行的列值進行計算。這個函數可以包含MySQL中有效的、產生非負整數值的任何表達式。 | 較多 |
| 4 | KEY 分區(qū) | 類似于按照HASH分區(qū),除了區(qū)別在于KEY分區(qū)只支持計算一列或多列,且KEY分區(qū)的哈希函數是由MySQL 服務器提供。 | 一般 |
(1)range分區(qū):
每個分區(qū)的值位于一個給定的連續(xù)區(qū)間內之內。
PARTITION BY RANGE (id) ( ?
? ? ? ? ?PARTITION p0 VALUES LESS THAN (3), ?
? ? ? ? ?PARTITION p1 VALUES LESS THAN (6), ?
? ? ? ? ?PARTITION p2 VALUES LESS THAN (9), ?
? ? ? ? ?PARTITION p3 VALUES LESS THAN (12), ?
? ? ? ? ?PARTITION p4 VALUES LESS THAN MAXVALUE ?
); ?
(2)List分區(qū):
類似于按RANGE分區(qū),區(qū)別在于LIST分區(qū)是基于列值匹配一個離散值集合中的某個值來進行選擇。
PARTITION BY LIST (province_id) ( ?
? ? ? ? ?PARTITION p0 VALUES IN (1,2,3,4,5,6,7,8), ?
? ? ? ? ?PARTITION p1 VALUES IN (9,10,11,12,16,21), ?
? ? ? ? ?PARTITION p2 VALUES IN (13,14,15,19), ?
? ? ? ? ?PARTITION p3 VALUES IN (17,18,20,22,23,24) ?
?);
?(3)Hash分區(qū):
基于用戶定義的表達式的返回值來進行選擇的分區(qū),該表達式使用將要插入到表中的這些行的列值進行計算。這個函數可以包含MySQL中有效的、產生非負整數值的任何表達式。?
HASH分區(qū)主要用來確保數據在預先確定數目的分區(qū)中平均分布。在RANGE和LIST分區(qū)中,必須明確指定一個給定的列值或列值集合應該保存在哪個分區(qū)中。?
create table foo_hash
(empno varchar(20) not null ,
empname varchar(20),
deptno int,
birthdate date not null,
salary int
)
partition by hash(year(birthdate))
partitions 4;
以上創(chuàng)建了4個分區(qū)。
(4)Key分區(qū):
類似于按HASH分區(qū),區(qū)別在于KEY分區(qū)只支持計算一列或多列,且MySQL服務器提供其自身的哈希函數。必須有一列或多列包含整數值。
create table foo_key
(empno varchar(20) not null ,
empname varchar(20),
deptno int,
birthdate date not null,
salary int
)
partition by key(birthdate)
partitions 4;
(5)復合分區(qū):
子分區(qū)是針對 RANGE/LIST 類型的分區(qū)表中每個分區(qū)的再次分割。子分區(qū)可以是 HASH/KEY 等類型。
PARTITION BY RANGE (uid) SUBPARTITION BY HASH (uid % 4) SUBPARTITIONS 2(
?????PARTITION p0 VALUES LESS THAN (3000000)
?????DATA DIRECTORY = '/data0/data'
?????INDEX DIRECTORY = '/data1/idx',
?????PARTITION p1 VALUES LESS THAN (6000000)
?????DATA DIRECTORY = '/data2/data'
?????INDEX DIRECTORY = '/data3/idx'
);
以上例子,對 RANGE 分區(qū)再次進行子分區(qū)劃分,子分區(qū)采用 HASH 類型。
?
二、常見分區(qū)操作:
?
總結
以上是生活随笔為你收集整理的MySQL数据库:分区Partition的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL数据库:drop、trunca
- 下一篇: MySQL数据库:读写分离