MHA故障切换和在线手工切换原理
一、故障切換的過(guò)程
當(dāng)master_manager監(jiān)控到主庫(kù)mysqld服務(wù)停止后,首先對(duì)主庫(kù)進(jìn)行SSH登錄檢查(save_binary_logs -command=test),然后對(duì)mysqld服務(wù)進(jìn)行健康檢查(PING(SELECT)每個(gè)3秒檢查一次,持續(xù)3次),最后作出Master is down!的判斷,master failover開(kāi)始
?
第1步:先根據(jù)配置文件檢測(cè)當(dāng)前的復(fù)制環(huán)境中有哪些服務(wù)器,MHA也會(huì)校驗(yàn)諸如復(fù)制異常以及是否存在一些從庫(kù)有不同的主庫(kù),啟動(dòng)failover(排除上次failover失敗或者failover時(shí)間間隔太短)
?
第2步:隔離master server,把故障主庫(kù)的VIP停掉(前提是你需要指定相關(guān)的腳本,比如:如果有master_ip_failover_script則會(huì)調(diào)用腳本停掉VIP、如果有shutdown_script腳本則調(diào)用腳本關(guān)閉master避免腦裂,在安裝包的samples/scriptes目錄下)
?
第3步:選舉新主庫(kù)并盡量補(bǔ)全新主庫(kù)的數(shù)據(jù)。
3.1?獲取同步位置最靠前的從庫(kù):對(duì)比所有從庫(kù)的master_log_file和read_master_log_pos位置找出執(zhí)行位置最新和最舊的從庫(kù)對(duì)應(yīng)的故障主庫(kù)的binlog位置。
3.2保存dead master的binlog:在故障主庫(kù)上執(zhí)行save_binary_logs命令獲得lastest slave同步位置與master間的binlog差異(使用3.1步驟找到的同步最靠前的從庫(kù)binlog位置,如果故障主庫(kù)系統(tǒng)沒(méi)掛的情況下)并scp到monitor server上。
3.3?確定新的主庫(kù):先使用命令apply_diff_relay_logs --command=find把前面3.1步驟中找出的同步位置最靠前和最靠后的對(duì)應(yīng)主庫(kù)的binlog位置作為參數(shù),在同步位置最靠前的從庫(kù)上執(zhí)行這個(gè)命令在其中繼日志中找出兩個(gè)binlog位置之間的relay log并生成文件用于恢復(fù)其他從庫(kù)(這里就是檢查同步最靠前的從庫(kù)是否有從最老的位置開(kāi)始的中繼日志,這也是為什么MHA環(huán)境中執(zhí)行過(guò)的中繼日志不能刪除的原因,否則這個(gè)對(duì)比就比較麻煩)。
接著尋找及決定新的主庫(kù),根據(jù)配置選擇如何提升新主庫(kù)(檢查是否有設(shè)置candidate_master=1和no_master=1,如果有設(shè)置候選主庫(kù),那么候選主庫(kù)中標(biāo),但候選庫(kù)不一定就是有最新數(shù)據(jù)的slave,所以需要跟其他從庫(kù)進(jìn)行比較,當(dāng)然如果候選主庫(kù)恰好是同步位置最靠前的從庫(kù),就不需要跟其他從庫(kù)進(jìn)行relay log比較了;如果沒(méi)有設(shè)置候選主庫(kù),那么同步位置最靠前的從庫(kù)中標(biāo))。monitor server也會(huì)將之前復(fù)制的差異binlog復(fù)制到新主庫(kù)上。
3.4?新的主庫(kù)應(yīng)用日志(如果有任何錯(cuò)誤從這個(gè)階段會(huì)發(fā)生,需要手動(dòng)恢復(fù)):新的主庫(kù)首選需要對(duì)比master_log_file=relay_master_log_file,read_master_log_pos=exec_master_log_pos確認(rèn)自己已經(jīng)執(zhí)行完成復(fù)制,如果新的主庫(kù)不是同步位置最靠前的從庫(kù),那么需要使用apply_diff_relay_logs --command=generate_and_send命令比較自己和同步位置最靠前的從庫(kù)之間的relay log是否存在差異,如果存在則需要生成一個(gè)差異relay log(如果新主庫(kù)就是同步位置最靠前的從庫(kù),那么只需要執(zhí)行monitor server發(fā)過(guò)來(lái)的差異日志即可),然后使用這兩個(gè)差異日志進(jìn)行恢復(fù)數(shù)據(jù)(apply_diff_relay_logs --command=apply命令)?;謴?fù)完成后獲取binlog位置并生成change master語(yǔ)句準(zhǔn)備用于其他從庫(kù)change master到新的主庫(kù)上,并設(shè)置read_only=0。然后把VIP綁定到新的主庫(kù)上。到這步驟新的主庫(kù)切換完成。
?
第4步:其他從庫(kù)恢復(fù):將其他從庫(kù)數(shù)據(jù)盡量補(bǔ)全(所有從庫(kù)并行執(zhí)行)。
4.1?并行使用apply_diff_relay_logs --command=generate_and_send命令判斷各個(gè)從庫(kù)的relay log位置和同步位置最靠前的從庫(kù)之間的relay log差異,并把差異文件從同步位置最靠前的從庫(kù)上發(fā)送到對(duì)應(yīng)的各個(gè)從庫(kù)上。
4.2?并行使用兩個(gè)差異日志進(jìn)行恢復(fù):將monitor server上的binlog差異拷貝到各個(gè)從庫(kù)上,然后各個(gè)從庫(kù)通過(guò)master_log_file=relay_master_log_file,read_master_log_pos=exec_master_log_pos先確認(rèn)自己已經(jīng)執(zhí)行完成復(fù)制,再應(yīng)用兩個(gè)差異日志恢復(fù)數(shù)據(jù)。最后,執(zhí)行reset slave,并重新CHANG MASTER到新主庫(kù)上。
第5步:新主庫(kù)執(zhí)行reset slave操作清除之前slave信息,到這里故障主庫(kù)切換到新主庫(kù)完成。
?
注意:如果中途有意外發(fā)生會(huì)終止failover操作,并產(chǎn)生mha_manager.failover.error的文件,下一次必須要?jiǎng)h除該文件才能正常failover,New Master延時(shí)超過(guò)30s或者binglog差100M時(shí)不會(huì)Auto Failover。
?
?
二、在線(xiàn)手動(dòng)切換過(guò)程
第1步:配置檢測(cè):根據(jù)配置文件檢測(cè)主從關(guān)系以及確定有哪些存活的服務(wù)器,然后在master上執(zhí)行FLUSH NO_WRITE_TO_BINLOG TABLES命令關(guān)閉打開(kāi)的表。再檢查從庫(kù)到主庫(kù)的復(fù)制是否正常。并根據(jù)配置決定新的主庫(kù)。
?
第2步:執(zhí)行FLUSH TABLES WITH READ LOCK鎖住所有的表阻塞主庫(kù)的寫(xiě)操作。等待其他從庫(kù)復(fù)制追趕上主庫(kù)。這里建議部署master_ip_online_change_script?腳本,該腳本會(huì)自動(dòng)阻塞以及kill原master session,置原master為只讀,停掉VIP(獲取舊主庫(kù)的binlog位置,使用master_log_wait()函數(shù)追趕主庫(kù))。同步完成之后,獲取新主庫(kù)的binlog位置,生成change master語(yǔ)句準(zhǔn)備用于其他從庫(kù)切換到新主庫(kù)。
?
第3步:所有其他從庫(kù)并行切換主庫(kù)到新主庫(kù)。使用第二步驟獲取的舊主庫(kù)的binlog位置,所有其他從庫(kù)使用master_log_wait()函數(shù)追趕主庫(kù)。然后使用change master切換到新的主庫(kù)上。
?
第4步:舊主庫(kù)unlock tables,并change master到新的主庫(kù)上。
?
第5步:新的主庫(kù)reset slave,綁定VIP在新的主庫(kù)上。
?
注:本文為根據(jù)MHA切換輸出日志整理,個(gè)人理解如有錯(cuò)誤,還望指正!
?
?
作者:xiaoboluo
出處:xiaoboluo的博客 http://www.cnblogs.com/xiaoboluo768/
感謝您的認(rèn)真閱讀。本文版權(quán)歸作者所有,歡迎轉(zhuǎn)載,但請(qǐng)保留該聲明。
轉(zhuǎn)載于:https://blog.51cto.com/arthur376/1812358
總結(jié)
以上是生活随笔為你收集整理的MHA故障切换和在线手工切换原理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: pInvokeStackImbalanc
- 下一篇: 用JAVA日志来写诗