MySQL之PXC集群搭建
一、PXC 介紹
1.1 PXC 簡介
PXC?是一套?MySQL?高可用集群解決方案,與傳統(tǒng)的基于主從復(fù)制模式的集群架構(gòu)相比 PXC 最突出特點(diǎn)就是解決了詬病已久的數(shù)據(jù)復(fù)制延遲問題,基本上可以達(dá)到實(shí)時(shí)同步。而且節(jié)點(diǎn)與節(jié)點(diǎn)之間,他們相互的關(guān)系是對(duì)等的。PXC 最關(guān)注的是數(shù)據(jù)的一致性,對(duì)待事物的行為時(shí),要么在所有節(jié)點(diǎn)上執(zhí)行,要么都不執(zhí)行,它的實(shí)現(xiàn)機(jī)制決定了它對(duì)待一致性的行為非常嚴(yán)格,這也能非常完美的保證 MySQL 集群的數(shù)據(jù)一致性;
1.2 PXC特性和優(yōu)點(diǎn)
- 完全兼容 MySQL。
- 同步復(fù)制,事務(wù)要么在所有節(jié)點(diǎn)提交或不提交。
- 多主復(fù)制,可以在任意節(jié)點(diǎn)進(jìn)行寫操作。
- 在從服務(wù)器上并行應(yīng)用事件,真正意義上的并行復(fù)制。
- 節(jié)點(diǎn)自動(dòng)配置,數(shù)據(jù)一致性,不再是異步復(fù)制。
- 故障切換:因?yàn)橹С侄帱c(diǎn)寫入,所以在出現(xiàn)數(shù)據(jù)庫故障時(shí)可以很容易的進(jìn)行故障切換。
- 自動(dòng)節(jié)點(diǎn)克隆:在新增節(jié)點(diǎn)或停機(jī)維護(hù)時(shí),增量數(shù)據(jù)或基礎(chǔ)數(shù)據(jù)不需要人工手動(dòng)備份提供,galera cluster會(huì)自動(dòng)拉取在線節(jié)點(diǎn)數(shù)據(jù),集群最終會(huì)變?yōu)橐恢?#xff1b;
PXC最大的優(yōu)勢:強(qiáng)一致性、無同步延遲
1.3 PXC的局限和劣勢
- 復(fù)制只支持InnoDB?引擎,其他存儲(chǔ)引擎的更改不復(fù)制
- 寫入效率取決于節(jié)點(diǎn)中最慢的一臺(tái)
1.4 PXC與Replication的區(qū)別
| 數(shù)據(jù)同步是單向的,master負(fù)責(zé)寫,然后異步復(fù)制給slave;如果slave寫入數(shù)據(jù),不會(huì)復(fù)制給master。 | 數(shù)據(jù)同步時(shí)雙向的,任何一個(gè)mysql節(jié)點(diǎn)寫入數(shù)據(jù),都會(huì)同步到集群中其它的節(jié)點(diǎn)。 |
| 異步復(fù)制,從和主無法保證數(shù)據(jù)的一致性 | 同步復(fù)制,事務(wù)在所有集群節(jié)點(diǎn)要么同時(shí)提交,要么同時(shí)不提交 |
1.5 PXC 常用端口
- 3306:數(shù)據(jù)庫對(duì)外服務(wù)的端口號(hào)。
- 4444:請(qǐng)求SST的端口。
- 4567:組成員之間進(jìn)行溝通的一個(gè)端口號(hào)
- 4568:用于傳輸IST。
名詞解釋:
- SST(State Snapshot Transfer):?全量傳輸
- IST(Incremental state Transfer):增量傳輸
二、實(shí)踐
2.1 搭建 PXC 集群
與?MySQL?不同的是 PXC 官方提供了?Docker?鏡像,所以我們可以很方便的搭建 PXC 集群。
1)下載?Docker?鏡像
docker pull percona/percona-xtradb-cluster:5.73)刪除原始鏡像
docker rmi percona/percona-xtradb-cluster:5.7注:PXC容器只支持?jǐn)?shù)據(jù)卷掛載方式,不支持目錄掛載
因?yàn)楹罄m(xù)節(jié)點(diǎn)的添加需要關(guān)聯(lián)到第一個(gè)節(jié)點(diǎn),所以需要等待數(shù)據(jù)庫啟動(dòng)完成。通過?docker logs pn1?查看日志,如果出現(xiàn)下面的輸出,證明啟動(dòng)成功:
2019-09-04T06:27:30.085880Z 0 [Note] InnoDB: Buffer pool(s) load completed at 190904 6:27:30注:CLUSTER_NAME 名稱不要用關(guān)鍵字PXC,否則無法啟動(dòng)。
需要注意是第二個(gè)節(jié)點(diǎn)開始需要增加?e CLUSTER_JOIN=pn1?參數(shù),表示與?pn1?節(jié)點(diǎn)同步,否則?pn1?容器會(huì)自動(dòng)關(guān)閉。
當(dāng)?PXC集群中存在兩個(gè)節(jié)點(diǎn)以上之后就沒有主節(jié)點(diǎn)的概念了。集群中最后一個(gè)退出的節(jié)點(diǎn)就會(huì)變?yōu)橹鞴?jié)點(diǎn),在?/var/lib/mysql/grastate.dat?文件中屬性?safe_to_bootstrap?的值 會(huì)從?0?被設(shè)置為?1?表示該節(jié)點(diǎn)是主節(jié)點(diǎn)。
8)加入第三個(gè)節(jié)點(diǎn)
docker run -di --name=pn3 --net=pxc-network -p 9002:3306 -v v3:/var/lib/mysql --privileged -e MYSQL_ROOT_PASSWORD=123456 -e CLUSTER_NAME=cluster1 -e XTRABACKUP_PASSWORD=123456 -e CLUSTER_JOIN=pn2 pxc:5.7可以看到我們這次我們?CLUSTER_JOIN?的是?pn2?容器,可以證明我們剛剛說的?當(dāng) PXC 集群存在兩個(gè)節(jié)點(diǎn)以上之后就沒有主節(jié)點(diǎn)的概念了?這個(gè)說法是正確的。
9)進(jìn)入?pn1?節(jié)點(diǎn)
docker exec -it pn1 /usr/bin/mysql -uroot -p123456可以看到?wsrep_incoming_addresses?的值就是我們?nèi)齻€(gè)容器的IP地址
| wsrep_incoming_addresses | 172.19.0.2:3306,172.19.0.3:3306,172.19.0.4:3306 |集群完整性檢查:
| wsrep_cluster_state_uuid | 在集群所有節(jié)點(diǎn)的值應(yīng)該是相同的,有不同值的節(jié)點(diǎn),說明其沒有連接入集群. |
| wsrep_cluster_conf_id | 正常情況下所有節(jié)點(diǎn)上該值是一樣的.如果值不同,說明該節(jié)點(diǎn)被臨時(shí)”分區(qū)”了.當(dāng)節(jié)點(diǎn)之間網(wǎng)絡(luò)連接恢復(fù) 的時(shí)候應(yīng)該會(huì)恢復(fù)一樣的值. |
| wsrep_cluster_size | 如果這個(gè)值跟預(yù)期的節(jié)點(diǎn)數(shù)一致,則所有的集群節(jié)點(diǎn)已經(jīng)連接. |
| wsrep_cluster_status | 集群組成的狀態(tài).如果不為”Primary”,說明出現(xiàn)”分區(qū)”或是”split-brain”腦裂狀況. |
節(jié)點(diǎn)狀態(tài)檢查:
| wsrep_ready | 該值為 ON,則說明可以接受 SQL 負(fù)載.如果為 Off,則需要檢查 wsrep_connected |
| wsrep_connected | 如果該值為 Off,且 wsrep_ready 的值也為 Off,則說明該節(jié)點(diǎn)沒有連接到集群.(可能是 wsrep_cluster_address 或 wsrep_cluster_name 等配置錯(cuò)造成的.具體錯(cuò)誤需要查看錯(cuò)誤日志) |
| wsrep_local_state_comment | 如果 wsrep_connected 為 On,但 wsrep_ready 為 OFF,則可以從該項(xiàng)查看原因 |
復(fù)制健康檢查:
| wsrep_flow_control_paused | 表示復(fù)制停止了多長時(shí)間.即表明集群因?yàn)?Slave 延遲而慢的程度.值為 0~1,越靠近 0 越好,值為 1 表示 復(fù)制完全停止.可優(yōu)化 wsrep_slave_threads 的值來改善 |
| wsrep_cert_deps_distance | 有多少事務(wù)可以并行應(yīng)用處理.wsrep_slave_threads 設(shè)置的值不應(yīng)該高出該值太多 |
| wsrep_flow_control_sent | 表示該節(jié)點(diǎn)已經(jīng)停止復(fù)制了多少次 |
| *wsrep_local_recv_queue_avg | 表示 slave 事務(wù)隊(duì)列的平均長度.slave 瓶頸的預(yù)兆. 最慢的節(jié)點(diǎn)的 wsrep_flow_control_sent 和 wsrep_local_recv_queue_avg 這兩個(gè)值最高.這兩個(gè)值較低的話,相對(duì)更好 |
檢測慢網(wǎng)絡(luò)問題:
| wsrep_local_send_queue_avg | 網(wǎng)絡(luò)瓶頸的預(yù)兆.如果這個(gè)值比較高的話,可能存在網(wǎng)絡(luò)瓶頸 |
沖突或死鎖的數(shù)目:
| wsrep_last_committed | 最后提交的事務(wù)數(shù)目 |
| wsrep_local_cert_failures 和 wsrep_local_bf_aborts | 回滾,檢測到的沖突數(shù)目 |
2.2 集群同步驗(yàn)證
4)在節(jié)點(diǎn)三上查看表結(jié)構(gòu)
mysql> use test; Reading table information for completion of table and column names You can turn off this feature to get a quicker startup with -ADatabase changed mysql> show tables; +----------------+ | Tables_in_test | +----------------+ | sys_user | +----------------+ 1 row in set (0.00 sec)看到?jīng)]有顯示的主鍵就無法插入數(shù)據(jù),我們修改下表結(jié)構(gòu):
alter table sys_user add primary key (id);插入數(shù)據(jù):
mysql> insert into sys_user values(1,'a'); Query OK, 1 row affected (0.05 sec)6)在節(jié)點(diǎn)一查看表數(shù)據(jù)
mysql> select * from sys_user; +----+------+ | id | name | +----+------+ | 1 | a | +----+------+ 1 row in set (0.00 sec)可以看到三個(gè)節(jié)點(diǎn)數(shù)據(jù)正常同步,并且都可讀可寫。
2.3 新增數(shù)據(jù)庫節(jié)點(diǎn)操作
當(dāng)數(shù)據(jù)庫不夠用時(shí),我們通常需要增加數(shù)據(jù)庫節(jié)點(diǎn)來分擔(dān)壓力,我們來演示一下新增節(jié)點(diǎn)的操作。
2)新增容器
docker run -di --name=pn4 --net=pxc-network -p 9003:3306 -v v4:/var/lib/mysql --privileged -e MYSQL_ROOT_PASSWORD=123456 -e CLUSTER_NAME=cluster1 -e XTRABACKUP_PASSWORD=123456 -e CLUSTER_JOIN=pn3 pxc:5.7要注意的是,這次?CLUSTER_JOIN?連的是?pn3。
可以看到之前的數(shù)據(jù)也自動(dòng)同步過來了。
2.4 宕機(jī)操作
可以看到集群應(yīng)該有4個(gè)節(jié)點(diǎn),但是現(xiàn)在只有3個(gè)正常連接。
3)在節(jié)點(diǎn)?pn2?上做修改操作
mysql> update sys_user set name='b' where id=1; Query OK, 1 row affected (0.00 sec) Rows matched: 1 Changed: 1 Warnings: 0可以看到節(jié)點(diǎn)正常加入集群,并且數(shù)據(jù)也同步了。
pn4?是以指定主節(jié)點(diǎn)形式進(jìn)入?PXC?集群創(chuàng)建的容器,那么?pn1直接以自身為主節(jié)點(diǎn)啟動(dòng)的容器會(huì)怎么樣呢?我們來演示一下:
等待一分鐘,查看容器啟動(dòng)列表
docker ps -a發(fā)現(xiàn)?pn1?節(jié)點(diǎn)并沒有啟動(dòng)
CONTAINER ID IMAGE ...... STATUS NAMES fa123563e787 pxc:5.7 ...... Exited (1) About a minute ago pn1查看下錯(cuò)誤日志:
docker logs pn1異常信息如下:
2019-09-04T07:21:56.412918Z 0 [ERROR] WSREP: It may not be safe to bootstrap the cluster from this node. It was not the last one to leave the cluster and may not contain all the updates. To force cluster bootstrap with this node, edit the grastate.dat file manually and set safe_to_bootstrap to 1 . 2019-09-04T07:21:56.412922Z 0 [ERROR] WSREP: Provider/Node (gcomm://) failed to establish connection with cluster (reason: 7) 2019-09-04T07:21:56.412929Z 0 [ERROR] Aborting翻譯成中文:
2019-09-04T07:21:56.412918Z 0 [錯(cuò)誤] WSREP:從此節(jié)點(diǎn)引導(dǎo)群集可能不安全。 它不是離開群集的最后一個(gè),可能不包含所有更新。 要使用此節(jié)點(diǎn)強(qiáng)制群集引導(dǎo),請(qǐng)手動(dòng)編輯grastate.dat文件并將safe_to_bootstrap設(shè)置為1。 2019-09-04T07:21:56.412922Z 0 [錯(cuò)誤] WSREP:提供者/節(jié)點(diǎn)(gcomm://)無法與群集建立連接(原因:7) 2019-09-04T07:21:56.412929Z 0 [錯(cuò)誤]中止錯(cuò)誤提示很明顯了,因?yàn)?pn1?節(jié)點(diǎn)不是最后一個(gè)離開集群的不能再以主節(jié)點(diǎn)的形式啟動(dòng)了,如果要以主節(jié)點(diǎn)的形式啟動(dòng)必須調(diào)整?grastate.dat文件中的?safe_to_bootstrap?參數(shù)為?1。
但是要注意的是因?yàn)榧褐衅渌?jié)點(diǎn)并沒有關(guān)閉,這樣啟動(dòng)的容器跟之前的集群就沒有關(guān)系了數(shù)據(jù)也不會(huì)同步,我們來驗(yàn)證下看看:
將?safe_to_bootstrap?參數(shù)值修改為1,保存退出
# GALERA saved state version: 2.1 uuid: 068dd5e8-cedd-11e9-904d-466e75bd8fe1 seqno: 20 safe_to_bootstrap: 1發(fā)現(xiàn)數(shù)據(jù)并沒有同步,那么要怎么將?pn1?節(jié)點(diǎn)加入到集群中呢?
我們可以直接將?pn1?容器刪除,以加入節(jié)點(diǎn)的形式重新創(chuàng)建容器,并且因?yàn)槲覀冎耙呀?jīng)將容器的數(shù)據(jù)掛載到數(shù)據(jù)卷了,所以數(shù)據(jù)也不會(huì)存在丟失的風(fēng)險(xiǎn),我們來操作下:
等待容器初始化完畢
3)進(jìn)入容器,查看數(shù)據(jù)是否同步
docker exec -it pn1 /usr/bin/mysql -uroot -p123456 mysql> use test; Reading table information for completion of table and column names You can turn off this feature to get a quicker startup with -ADatabase changed mysql> select * from sys_user; +----+------+ | id | name | +----+------+ | 1 | b | | 2 | c | +----+------+ 2 rows in set (0.00 sec)發(fā)現(xiàn)數(shù)據(jù)已經(jīng)同步了。
總結(jié)
以上是生活随笔為你收集整理的MySQL之PXC集群搭建的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于MATLAB的车牌识别系统研究
- 下一篇: linux 安装mysql 指定目录_L