云上技术 | 混合云多活容灾方案
業(yè)務(wù)容災(zāi)現(xiàn)今發(fā)展趨勢
近年來隨著中國科技水平進(jìn)步和數(shù)字化程度加深,企業(yè)開展工作高度依賴業(yè)務(wù)信息的傳遞和管理,數(shù)據(jù)中心所承載的業(yè)務(wù)復(fù)雜度大幅提高,與之對應(yīng)面臨的風(fēng)險(xiǎn)和威脅也越來越大,一旦數(shù)據(jù)中心因?yàn)橥话l(fā)故障中斷了服務(wù),造成的關(guān)鍵業(yè)務(wù)數(shù)據(jù)(客戶信息、知識資產(chǎn)等)丟失將會(huì)嚴(yán)重影響企業(yè)正常運(yùn)營。比較典型的例子有2014年,美國空軍國防企業(yè)記賬管理系統(tǒng)由于人為誤操作,刪除了數(shù)據(jù)庫中的重要文件,因無異地容災(zāi)系統(tǒng),導(dǎo)致直接損失22億美元。2010年玉樹地震中,某檔案館13萬卷數(shù)字檔案被毀,因缺少異地容災(zāi)手段,導(dǎo)致數(shù)據(jù)無法恢復(fù)。據(jù)Gartner Group統(tǒng)計(jì),三分之一的企業(yè)在業(yè)務(wù)中斷后的 4 個(gè)月之內(nèi)倒閉。 特別是金融證券、國家安全等領(lǐng)域,關(guān)系到國家經(jīng)濟(jì)建設(shè)、社會(huì)發(fā)展和國防的戰(zhàn)略性核心信息資源,保障其數(shù)據(jù)安全可靠,避免計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)災(zāi)難導(dǎo)致的數(shù)據(jù)損失是非常必要的。然而包含有大量電子設(shè)備的數(shù)據(jù)中心出現(xiàn)突發(fā)故障又是不可避免的,日常隨時(shí)可能出現(xiàn)像硬件自然老化、人工操作不當(dāng)、軟件功能缺陷或黑客對系統(tǒng)蓄意攻擊等,都會(huì)導(dǎo)致系統(tǒng)運(yùn)行的非正常中斷,影響系統(tǒng)中數(shù)據(jù)的正確性或破壞系統(tǒng)數(shù)據(jù)庫,致使部分甚至全部數(shù)據(jù)丟失。更不必說遭遇影響面廣泛的火災(zāi)、地震、洪水等災(zāi)難,將對數(shù)據(jù)中心產(chǎn)生毀滅性打擊,業(yè)務(wù)恢復(fù)會(huì)難上加難。
傳統(tǒng)業(yè)務(wù)容災(zāi)面臨的問題
既然故障的出現(xiàn)是必然事件,有沒有一個(gè)完善的災(zāi)備方案來保證業(yè)務(wù)運(yùn)轉(zhuǎn),將企業(yè)損失降到最低呢? 傳統(tǒng)災(zāi)備給出了“主備雙數(shù)據(jù)中心”方案。主數(shù)據(jù)中心提供日常數(shù)據(jù)讀寫服務(wù),災(zāi)難備份中心并不提供線上服務(wù),但會(huì)實(shí)時(shí)同步主數(shù)據(jù)中心的數(shù)據(jù)。一旦主數(shù)據(jù)中心出現(xiàn)故障,通過人工的方式,手動(dòng)的將主數(shù)據(jù)中心切換為災(zāi)難備份中心來繼續(xù)提供服務(wù)。 隨著企業(yè)接入使用,就會(huì)發(fā)現(xiàn)其明顯的缺點(diǎn):一方面因?yàn)楣收虾笕斯で袚Q,需要24小時(shí)值守的運(yùn)維人力,而人的反應(yīng)速度有限仍會(huì)處理不及時(shí)。另一方面?zhèn)鋽?shù)據(jù)中心不對外本身就是資源浪費(fèi),且備數(shù)據(jù)中心長時(shí)間不對外服務(wù),關(guān)鍵時(shí)刻切換,是否可以保證仍然可用也要畫一個(gè)問號。此外,對業(yè)務(wù)量龐大的中大型企業(yè)來說,提供服務(wù)的主數(shù)據(jù)中心停留在單地域,備數(shù)據(jù)中心完全不服務(wù)這種模式,會(huì)遇到單地域資源瓶頸問題。
多活容災(zāi)解決方案的架構(gòu)與特性
針對傳統(tǒng)方案的種種問題,阿里云經(jīng)由阿里巴巴電商業(yè)務(wù)環(huán)境逐步演進(jìn),在混合云場景可提供多活容災(zāi)架構(gòu)解決方案(Multi-Site High Availability),阿里云混合云能夠幫助業(yè)務(wù)系統(tǒng)快速實(shí)現(xiàn)異地雙活。其主要原理是兩個(gè)數(shù)據(jù)中心同時(shí)對外服務(wù),運(yùn)行相同的應(yīng)用,具備同樣的數(shù)據(jù),出現(xiàn)故障時(shí)數(shù)據(jù)中心自動(dòng)切換,用戶無感知,實(shí)現(xiàn)持續(xù)的應(yīng)用可用性和災(zāi)難備份能力。并且通過資源整合還可以使“雙活”數(shù)據(jù)中心的服務(wù)能力翻倍,最大化利用IT資源。 阿里云混合云多活容災(zāi)架構(gòu)解決方案由架構(gòu)加管控組合而成,架構(gòu)上將業(yè)務(wù)分為接入層、應(yīng)用層、數(shù)據(jù)層三層,應(yīng)用層又可以細(xì)分為微服務(wù)調(diào)用、消息等多個(gè)功能域,每一層都會(huì)有相應(yīng)的多活組件,管控在各層組件的基礎(chǔ)上具備全棧的多活管控能力,將業(yè)務(wù)恢復(fù)和故障恢復(fù)解耦,并基于靈活的規(guī)則調(diào)度、跨域跨云管控、數(shù)據(jù)保護(hù)等能力,保障故障場景下的業(yè)務(wù)快速恢復(fù)。 異地雙活架構(gòu)主要有如下4個(gè)核心特性:1、自上而下的流量管理:應(yīng)用層和接入層進(jìn)行流量路由,錯(cuò)誤流量糾錯(cuò)和阻斷,流量在單元封閉,當(dāng)故障發(fā)生時(shí)將爆炸半徑控制在單元內(nèi)
2、低門檻接入:提供無代碼侵入的MSHA-Agent,自動(dòng)識別流量路由標(biāo)并進(jìn)行流量染色,支持眾多開源RPC、MQ框架
3、數(shù)據(jù)雙向同步:數(shù)據(jù)增量異步實(shí)時(shí)雙向復(fù)制(如服務(wù)、消息、數(shù)據(jù)庫等),同時(shí)解決了環(huán)形復(fù)制問題
4、數(shù)據(jù)防臟寫:錯(cuò)誤流量禁寫保護(hù)避免臟寫,切流期間禁寫、禁更新保護(hù)避免臟寫
業(yè)務(wù)的典型應(yīng)用場景
落地到具體應(yīng)用可以按業(yè)務(wù)數(shù)據(jù)維度分成三種類型,分別為讀多寫少型業(yè)務(wù)、流水單據(jù)型業(yè)務(wù)、狀態(tài)依賴型業(yè)務(wù)。其中讀多寫少型業(yè)務(wù)、流水單據(jù)型業(yè)務(wù)在混合云場景較為常用。 典型的讀多寫少型業(yè)務(wù)有資訊、導(dǎo)購類的服務(wù),例如商品瀏覽、新聞資訊等。其數(shù)據(jù)特點(diǎn)是讀多寫少,用戶關(guān)注的是導(dǎo)購頁中的商品信息,通常不關(guān)注商品的上架過程,因此讀鏈路是核心,而寫鏈路是可以被接受短暫的不可用,這種業(yè)務(wù)特性非常適合采用異地多讀架構(gòu)。讀鏈路異地多活而寫鏈路保持單點(diǎn)(單地域?qū)?#xff09;,建設(shè)成本低、改造內(nèi)容少、投入產(chǎn)出比高。 而流水單據(jù)型業(yè)務(wù)較讀多寫少型業(yè)務(wù)是更復(fù)雜的讀寫業(yè)務(wù),主要電商交易、賬單流水類服務(wù),例如訂單下單、通話記錄等。更適用于異地雙活架構(gòu)來進(jìn)行建設(shè)。目前,阿里混合云多活容災(zāi)解決方案已服務(wù)多家客戶。中國聯(lián)通總部智慧客服聯(lián)合阿里云,打造了智能化、集約化的云化雙活客服系統(tǒng),實(shí)現(xiàn)聯(lián)通客服從接入、外呼到智能IVR、知識中心等7大業(yè)務(wù)域的雙活容災(zāi)。歷次大規(guī)模雙活容災(zāi)演練,業(yè)務(wù)系統(tǒng)秒級切換,為聯(lián)通智慧客服提供了有力的容量及容災(zāi)保障。
結(jié)語
云平臺承載的在線業(yè)務(wù)系統(tǒng)直接關(guān)系到國計(jì)民生,影響重大,一旦出現(xiàn)數(shù)據(jù)篡改丟失和系統(tǒng)長期無法訪問,后果難以承受。阿里云混合云多活容災(zāi)持續(xù)為客戶的核心業(yè)務(wù)保駕護(hù)航,為了切實(shí)確保數(shù)據(jù)安全做到萬無一失。多活容災(zāi)混合云解決方案演示
阿里云混合云為政企提供量身打造的混合云解決方案
從建好云、管好云、用好云三大維度提供客戶視角的一體化云平臺服務(wù)
更多混合云資訊,前往混合云官網(wǎng)
原文鏈接:https://developer.aliyun.com/article/783350?
版權(quán)聲明:本文內(nèi)容由阿里云實(shí)名注冊用戶自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權(quán),亦不承擔(dān)相應(yīng)法律責(zé)任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務(wù)協(xié)議》和《阿里云開發(fā)者社區(qū)知識產(chǎn)權(quán)保護(hù)指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權(quán)投訴表單進(jìn)行舉報(bào),一經(jīng)查實(shí),本社區(qū)將立刻刪除涉嫌侵權(quán)內(nèi)容。總結(jié)
以上是生活随笔為你收集整理的云上技术 | 混合云多活容灾方案的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android WebView 致安卓应
- 下一篇: Apache Flink Meetup