日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

灾备理论-可靠的异地灾备

發(fā)布時(shí)間:2025/1/21 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 灾备理论-可靠的异地灾备 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1. 技術(shù)背景

1.1.? 災(zāi)備評(píng)價(jià)指標(biāo)

業(yè)界普遍數(shù)據(jù)丟失量和系統(tǒng)恢復(fù)時(shí)間作為標(biāo)準(zhǔn),對(duì)某個(gè)容災(zāi)系統(tǒng)進(jìn)行評(píng)價(jià),公認(rèn)的評(píng)價(jià)標(biāo)準(zhǔn)是RPORTO
  RPORecoveryPointObjective):恢復(fù)點(diǎn)目標(biāo),以時(shí)間為單位,即在災(zāi)難發(fā)生時(shí),系統(tǒng)和數(shù)據(jù)必須恢復(fù)到的時(shí)間點(diǎn)要求。RPO標(biāo)志系統(tǒng)能夠容忍的最大數(shù)據(jù)丟失量,系統(tǒng)容忍丟失的數(shù)據(jù)量越小,RPO的值越小。
  RTO(RecoveryTimeObjective):恢復(fù)時(shí)間目標(biāo),以時(shí)間為單位,即在災(zāi)難發(fā)生后,信息系統(tǒng)或業(yè)務(wù)功能從停止到必須恢復(fù)的時(shí)間要求。RTO標(biāo)志系統(tǒng)能夠容忍的服務(wù)停止的最長(zhǎng)時(shí)間。系統(tǒng)服務(wù)的緊迫性要求越高,RTO的值越小。
  RPO針對(duì)的是數(shù)據(jù)丟失,RTO針對(duì)的是服務(wù)丟失,兩者沒(méi)有必然的聯(lián)系,并且兩者的確必須在進(jìn)行風(fēng)險(xiǎn)分析和業(yè)務(wù)影響分析之后根據(jù)業(yè)務(wù)的需求來(lái)確定。

?

1.2.? 災(zāi)難恢復(fù)能力等級(jí)

要建設(shè)容災(zāi)系統(tǒng),就必須提出相應(yīng)的設(shè)計(jì)指標(biāo),以此作為衡量和選擇容災(zāi)解決方案的參數(shù)。目前,國(guó)際上通用的容災(zāi)系統(tǒng)的評(píng)審標(biāo)準(zhǔn)為SHARE 78,主要包括以下內(nèi)容。
  備份/恢復(fù)的范圍
  災(zāi)難恢復(fù)計(jì)劃的狀態(tài)
  業(yè)務(wù)中心與容災(zāi)中心之間的距離
  業(yè)務(wù)中心與容災(zāi)中心之間如何連接
  數(shù)據(jù)是怎樣在兩個(gè)中心之間傳送的
  允許有多少數(shù)據(jù)丟失
  保證更新的數(shù)據(jù)在容災(zāi)中心被更新
  容災(zāi)中心可以開(kāi)始容災(zāi)進(jìn)程的能力
  SHARE 78是建立容災(zāi)系統(tǒng)的一種評(píng)審標(biāo)準(zhǔn)。建立容災(zāi)系統(tǒng)的最終目的,是為了在災(zāi)難發(fā)生后能夠以最快速度恢復(fù)數(shù)據(jù)服務(wù),主要體現(xiàn)在RTORPO上。在SHARE?78的基礎(chǔ)上,國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局和國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)聯(lián)合制定規(guī)范了適合我國(guó)國(guó)情的RTO/RPO與災(zāi)難恢復(fù)能力等級(jí)的關(guān)系。

RTO/RPO與災(zāi)難恢復(fù)能力等級(jí)的關(guān)系表

等級(jí)

RPO

RTO

備注

1級(jí)

2天以上

1天至7

<0.1%

2級(jí)

24小時(shí)以上

1天至7

90%

3級(jí)

12小時(shí)以上

數(shù)小時(shí)至1

6%

4級(jí)

數(shù)小時(shí)至2

數(shù)小時(shí)至1

<0.5%

5級(jí)

數(shù)分鐘至2

030分鐘

<0.1%

6級(jí)

數(shù)分鐘

0

3%

?

1.3.? 容災(zāi)的分類

由于容災(zāi)包含的內(nèi)容比較廣泛,對(duì)容災(zāi)的分類也可以從多個(gè)方面進(jìn)行。總的來(lái)講,可以從容災(zāi)的范圍和容災(zāi)的內(nèi)容來(lái)區(qū)分。

從容災(zāi)的范圍講,容災(zāi)可以分成本地容災(zāi),近距離(同城)容災(zāi)和遠(yuǎn)距離(異地)容災(zāi)。這三種容災(zāi)能容的災(zāi)難是不相同的,采用的容災(zāi)技術(shù)也是不同的。

從容災(zāi)的層次講,容災(zāi)又可以分成數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi),數(shù)據(jù)容災(zāi)是應(yīng)用容災(zāi)的基礎(chǔ),沒(méi)有數(shù)據(jù)的一致性,就沒(méi)有應(yīng)用的連續(xù)性,應(yīng)用容災(zāi)也是無(wú)法保證的。數(shù)據(jù)容災(zāi)是指建立一個(gè)備用的數(shù)據(jù)系統(tǒng),該備用系統(tǒng)對(duì)生產(chǎn)系統(tǒng)的關(guān)鍵數(shù)據(jù)進(jìn)行備份。

應(yīng)用容災(zāi)則是在數(shù)據(jù)容災(zāi)之上,建立一套與生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng)。在災(zāi)難發(fā)生后,將應(yīng)用迅速切換到備用系統(tǒng),備份系統(tǒng)承擔(dān)生產(chǎn)系統(tǒng)的業(yè)務(wù)運(yùn)行。

?

1.4.? 主流數(shù)據(jù)容災(zāi)技術(shù)

1.4.1.?? 數(shù)據(jù)備份

數(shù)據(jù)備份是系統(tǒng)、數(shù)據(jù)容災(zāi)的基礎(chǔ),也是低端容災(zāi)的實(shí)現(xiàn),是高端容災(zāi)(實(shí)時(shí)數(shù)據(jù)保護(hù))的有力保障。目前備份技術(shù)主要有快照備份、離線備份、異地存儲(chǔ)備份。備份系統(tǒng)通過(guò)備份策略,對(duì)計(jì)算機(jī)信息系統(tǒng)的操作系統(tǒng)、文件系統(tǒng)、應(yīng)用程序、數(shù)據(jù)庫(kù)系統(tǒng)等數(shù)據(jù)集,實(shí)現(xiàn)某一時(shí)間點(diǎn)的完整拷貝,拷貝的數(shù)據(jù)處在非在線狀態(tài),不能被立刻訪問(wèn),必須通過(guò)相應(yīng)操作,如恢復(fù)等方式使用備份數(shù)據(jù)。這也解決了高端容災(zāi)(實(shí)時(shí)數(shù)據(jù)保護(hù))不能解決的問(wèn)題:人為誤操作、惡意性操作等,這類操作,計(jì)算機(jī)系統(tǒng)是不能區(qū)分的,一旦執(zhí)行,將造成數(shù)據(jù)中心、災(zāi)備中心同時(shí)修改;對(duì)于數(shù)據(jù)庫(kù)系統(tǒng),在日志方式下,可以通過(guò)回滾方式修改,對(duì)于文件系統(tǒng)、操作系統(tǒng)等其他配置信息是不能回滾的,將造成毀滅性的結(jié)果。因此在建設(shè)高端容災(zāi)系統(tǒng)的前提,一定要做好本地系統(tǒng)的備份,這是容災(zāi)技術(shù)的起點(diǎn)。

目前成熟的備份軟件有Symantec NetBackupEMC LegatoIBM TSMHP Protect Server等等。

?

1.4.2.?? 實(shí)時(shí)數(shù)據(jù)保護(hù)

實(shí)時(shí)數(shù)據(jù)保護(hù),就是在多塊磁盤(pán)上、多個(gè)陣列、多臺(tái)服務(wù)器、多個(gè)數(shù)據(jù)中心實(shí)時(shí)的保存同一份數(shù)據(jù)的多份存儲(chǔ),目的是為了避免物理故障,數(shù)據(jù)不會(huì)因?yàn)橐粔K磁盤(pán)、一個(gè)陣列、一臺(tái)服務(wù)器、一個(gè)數(shù)據(jù)中心的故障,而不能訪問(wèn)。

實(shí)時(shí)數(shù)據(jù)保護(hù)需要以數(shù)據(jù)備份作為前提,它不能防范人為誤操作和惡性操作。這里我們要強(qiáng)調(diào)容災(zāi)的目的是讓數(shù)據(jù)在災(zāi)難發(fā)生時(shí),還能被訪問(wèn),通過(guò)實(shí)時(shí)數(shù)據(jù)保護(hù),保證數(shù)據(jù)的完整性;因此實(shí)時(shí)數(shù)據(jù)保護(hù)是容災(zāi)手段,而不是目的。目前實(shí)時(shí)數(shù)據(jù)保護(hù)的技術(shù)主要有兩種:數(shù)據(jù)鏡像和數(shù)據(jù)復(fù)制。

?

1.4.2.1.??? 數(shù)據(jù)鏡像(Mirroring

數(shù)據(jù)鏡像(Mirroring)是冗余的一種類型,一個(gè)磁盤(pán)上的數(shù)據(jù)在另一個(gè)磁盤(pán)上存在一個(gè)完全相同的副本即為鏡像。數(shù)據(jù)鏡像分為軟件鏡像與硬件鏡像,鏡像軟件有Symantec Volume Manager;各硬件廠商都有基于自己陣列的硬件鏡像方式。

在通過(guò)SAN的支持,DWDM的拓展,光纖網(wǎng)絡(luò)可以擴(kuò)展到100公里或更遠(yuǎn),鏡像可以在較遠(yuǎn)的兩個(gè)數(shù)據(jù)中心的磁盤(pán)上建立。但由于鏡像系統(tǒng)是以同步方式實(shí)現(xiàn)的,受到距離、光纖協(xié)議、和相關(guān)協(xié)議轉(zhuǎn)換的影響,同步方式會(huì)影響本地服務(wù)器的性能,所以,一般建議在<20公里的同城容災(zāi)中使用,在遠(yuǎn)程容災(zāi)中可作為一種加強(qiáng)方案與遠(yuǎn)程容災(zāi)方案整合。

基于SAN的鏡像支持所有的類型數(shù)據(jù)同步,包括文件數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)、裸設(shè)備、應(yīng)用配置文件、應(yīng)用程序、庫(kù)函數(shù)等,因而支持各類應(yīng)用系統(tǒng)容災(zāi),包括數(shù)據(jù)庫(kù)、中間件、客戶自己開(kāi)發(fā)的應(yīng)用,適用于2層架構(gòu)、3層或多層應(yīng)用架構(gòu)。

?

1.4.2.2.??? 數(shù)據(jù)復(fù)制(Replication

數(shù)據(jù)復(fù)制(Replication)是將一個(gè)原數(shù)據(jù)的及其改動(dòng),通過(guò)后續(xù)機(jī)制拷貝到另外一處,可以是另一個(gè)磁盤(pán)、另一個(gè)陣列、另一個(gè)服務(wù)器、另一個(gè)數(shù)據(jù)中心。由于實(shí)現(xiàn)的機(jī)制不同,又分為同步復(fù)制和異步復(fù)制兩種方式。同步復(fù)制,能夠確保兩份數(shù)據(jù)完全一致,但對(duì)系統(tǒng)的影響較大,一般不會(huì)采用;異步復(fù)制,通過(guò)后續(xù)機(jī)制,確保將本地改動(dòng)的數(shù)據(jù)復(fù)制的異地,對(duì)系統(tǒng)的影響較小,但數(shù)據(jù)同步有延遲,是目前實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)同步的主要方法。

根據(jù)實(shí)現(xiàn)機(jī)制,數(shù)據(jù)復(fù)制分為軟件方式和硬件方式;硬件方式往往又被稱為遠(yuǎn)程鏡像。此外還有數(shù)據(jù)庫(kù)復(fù)制和基于SAN的卷復(fù)制。

軟件復(fù)制Symantec Volume Replicator(簡(jiǎn)稱VVR)Datacore 等,軟件復(fù)制可以跨硬件平臺(tái),可以實(shí)現(xiàn)多廠商集成,其中VVR是基于卷的復(fù)制,復(fù)制的數(shù)據(jù)可以是數(shù)據(jù)庫(kù)中的數(shù)據(jù)(文件方式或裸設(shè)備方式),數(shù)據(jù)庫(kù)日志,復(fù)制的數(shù)據(jù)也可以是各種文件,如應(yīng)用和數(shù)據(jù)庫(kù)配置文件,應(yīng)用程序,庫(kù)文件,等等。Datacore是基于block的復(fù)制,類似于硬件的復(fù)制,處于卷的更底層,與基于卷的復(fù)制不同的是,他具有應(yīng)用操作系統(tǒng)的獨(dú)立性,數(shù)據(jù)的遠(yuǎn)程復(fù)制與操作系統(tǒng)無(wú)關(guān),并且不需要遠(yuǎn)端主機(jī)應(yīng)用系統(tǒng)的運(yùn)行,支持異步和同步的方式,并且與硬件存儲(chǔ)子系統(tǒng)不同的是,Datacore可以實(shí)現(xiàn)異構(gòu)存儲(chǔ)子系統(tǒng)的集中管理,打破了單一廠商選擇的限制,對(duì)于磁盤(pán)子系統(tǒng)的選擇更加靈活。

硬件復(fù)制一般是相同品牌之間的磁盤(pán)子系統(tǒng)的操作。具有一定的限制性,純硬件復(fù)制有HDS TrueCopyEMC SRDF等。硬件復(fù)制通過(guò)基于硬件的遠(yuǎn)程磁盤(pán)鏡像實(shí)現(xiàn),其實(shí)現(xiàn)要求嚴(yán)格。只能基于同一廠商、同樣容量大小的兩個(gè)陣列來(lái)實(shí)現(xiàn)。受光纖線路影響、復(fù)制數(shù)據(jù)量大,在使用間歇性復(fù)制時(shí),數(shù)據(jù)延遲大,磁盤(pán)容量要求4倍于源數(shù)據(jù),并且在極端情況下,不能保證數(shù)據(jù)一致性。廠商一般建議使用間歇性復(fù)制。遠(yuǎn)程磁盤(pán)鏡像(復(fù)制),在容災(zāi)實(shí)現(xiàn)中,支持所有的類型數(shù)據(jù)同步,包括文件數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)、裸設(shè)備、應(yīng)用配置文件、應(yīng)用程序、庫(kù)函數(shù)等,支持各類應(yīng)用系統(tǒng)容災(zāi),包括數(shù)據(jù)庫(kù)、中間件、客戶自己開(kāi)發(fā)的應(yīng)用,適用于2層架構(gòu)、3層或多層應(yīng)用架構(gòu)。

數(shù)據(jù)庫(kù)復(fù)制Oracle Data GuardOracle GoldenGateQuest SharePlexDSG RealSync等,通過(guò)分析數(shù)據(jù)庫(kù)Redo LogArchive Log 實(shí)現(xiàn)日志的復(fù)制,將分析結(jié)果直接或轉(zhuǎn)化為SQL語(yǔ)句傳到容災(zāi)中心,在容災(zāi)中通過(guò)心Apply數(shù)據(jù)庫(kù)日志或?qū)⑷罩巨D(zhuǎn)化的SQL語(yǔ)句重做,來(lái)保證容災(zāi)中心數(shù)據(jù)與生產(chǎn)中心數(shù)據(jù)一致。但數(shù)據(jù)庫(kù)復(fù)制也存在如下限制:一是數(shù)據(jù)庫(kù)復(fù)制,是專門(mén)針對(duì)相應(yīng)數(shù)據(jù)庫(kù)的,只能實(shí)現(xiàn)單一的數(shù)據(jù)庫(kù)復(fù)制。如果有ORACLESQLSERVER等多種數(shù)據(jù)庫(kù),就必須采用相互各不相同的數(shù)據(jù)庫(kù)復(fù)制技術(shù),管理和維護(hù)工作非常復(fù)雜;二是數(shù)據(jù)庫(kù)復(fù)制技術(shù)不是一個(gè)完整的容災(zāi)解決方案,只能有限的復(fù)制數(shù)據(jù)庫(kù)數(shù)據(jù),不能復(fù)制其他的應(yīng)用程序,配置文件,就是Oracle自己的tnsnames.ora, listner.orainitSID.ora, *.ctl也不能復(fù)制,一旦這些文件改動(dòng)過(guò),將需要管員人為操作或者需要其他軟件的管理,保證容災(zāi)中心與生產(chǎn)中心同步應(yīng)用、程序、配置文件同步。

基于SAN網(wǎng)絡(luò)的卷復(fù)制是一種新的復(fù)制方式,如DatacoreSDS。它是通過(guò)特殊的運(yùn)行于操作系統(tǒng)上的SDS SAN 控制器,實(shí)際是將低端的無(wú)智能存儲(chǔ)變?yōu)楦叨说闹悄艽鎯?chǔ),使得他們得以建立基于智能SAN 控制器的卷,通過(guò)這種與主機(jī)應(yīng)用無(wú)關(guān),但與SDS控制器直接相關(guān)的卷實(shí)現(xiàn)復(fù)制。此種技術(shù)較新,目前具有多家廠商均向此方向發(fā)展,其中Datacore是較早的研發(fā)廠商,當(dāng)中還有IBMSVCHDSUSP系列以及飛康CDP也是采用此種技術(shù)。

?

1.5.? 應(yīng)用和網(wǎng)絡(luò)容災(zāi)

數(shù)據(jù)復(fù)制是容災(zāi)的手段,不是目的,容災(zāi)的目的是數(shù)據(jù)的訪問(wèn),因此應(yīng)用的恢復(fù)和網(wǎng)絡(luò)的恢復(fù)也是容災(zāi)的關(guān)鍵。

應(yīng)用系統(tǒng)恢復(fù),這和系統(tǒng)的應(yīng)用模式直接相關(guān)。需要考慮應(yīng)用系統(tǒng)的應(yīng)用架構(gòu)。是Client/Server架構(gòu),還是Broswer/Server架構(gòu);是2層架構(gòu)、還是3層架構(gòu)、還是多層架構(gòu)。兩層架構(gòu),表示容災(zāi)中心的應(yīng)用只要啟動(dòng)數(shù)據(jù)庫(kù)就可以服務(wù)了。如果是三層架構(gòu),就意味著應(yīng)用系統(tǒng)除數(shù)據(jù)庫(kù)以外,還有網(wǎng)絡(luò)服務(wù)程序,如中間件WebLogic。在容災(zāi)應(yīng)用切換時(shí),能夠手工或自動(dòng)化的將這些服務(wù)一一啟動(dòng)。

在災(zāi)難發(fā)生后,應(yīng)用切換到災(zāi)備中心了,本地的應(yīng)用前端需要重新訪問(wèn)容災(zāi)節(jié)點(diǎn)的服務(wù),帶來(lái)另外一個(gè)問(wèn)題,網(wǎng)絡(luò)如何切換。實(shí)際上最簡(jiǎn)單的辦法,就是通過(guò)外部DNS服務(wù)器,

在災(zāi)難發(fā)生后,本地應(yīng)用訪問(wèn)路徑如何由指向原生產(chǎn)中心改為指向容災(zāi)中心。在災(zāi)難修復(fù)后,又需要指向原生產(chǎn)中心。最簡(jiǎn)單得方法就是更改外部DNS服務(wù)器得IP映射關(guān)系。在災(zāi)難發(fā)生前,IP映射為生產(chǎn)中心服務(wù)器;在災(zāi)難發(fā)生后,IP由映射為容災(zāi)中心得服務(wù)器;在災(zāi)難修復(fù)后,IP又映射為生產(chǎn)中心得服務(wù)器。

當(dāng)然,在一些中間件軟件中,支持多服務(wù)器、多IP的配置,那也是可以考慮的。

?

1.6.? 容災(zāi)切換

就是在災(zāi)難發(fā)生后,數(shù)據(jù)庫(kù)切換、應(yīng)用重新啟動(dòng)、網(wǎng)絡(luò)實(shí)現(xiàn)切換等等,容災(zāi)中心接管原生產(chǎn)中心的整個(gè)過(guò)程;同時(shí)還包含了在原數(shù)據(jù)中心修復(fù)后,數(shù)據(jù)庫(kù)、應(yīng)用、網(wǎng)絡(luò)需要重新切回來(lái)的整個(gè)過(guò)程。這些過(guò)程,可以通過(guò)手工切換、也可以通過(guò)自動(dòng)化過(guò)程完成。

?

1.7.? 容災(zāi)演

大部分的容災(zāi)方案,在項(xiàng)目實(shí)施后,很難有機(jī)會(huì)來(lái)實(shí)現(xiàn)預(yù)演,因?yàn)閷?duì)于大部分方案來(lái)說(shuō),這種預(yù)演活動(dòng),需要耗費(fèi)大量的人力財(cái)力。

但是這種預(yù)演是必不可少的,它是實(shí)時(shí)測(cè)試目前的容災(zāi)方案的漏洞,保證容災(zāi)方案在災(zāi)難發(fā)生時(shí),能夠真正生效。

?

?

2. 災(zāi)備系統(tǒng)建設(shè)

2.1.? 災(zāi)備系統(tǒng)選型要素

容災(zāi)技術(shù)的選擇,是一個(gè)以業(yè)務(wù)容災(zāi)需求為核心,多種因素綜合權(quán)衡的過(guò)程。容災(zāi)技術(shù)選擇所需考慮的因素
一、業(yè)務(wù)分析結(jié)果
  容災(zāi)系統(tǒng)建設(shè)應(yīng)根據(jù)業(yè)務(wù)分析結(jié)果選擇合適的容災(zāi)技術(shù)并確定具體的實(shí)現(xiàn)策略,以滿足業(yè)務(wù)恢復(fù)時(shí)相應(yīng)的RTORPO指標(biāo)。
二、業(yè)務(wù)關(guān)聯(lián)程度
  在進(jìn)行容災(zāi)技術(shù)選擇時(shí),需要考慮到核心業(yè)務(wù)系統(tǒng)各種業(yè)務(wù)之間的關(guān)聯(lián)關(guān)系。業(yè)務(wù)關(guān)聯(lián)緊密,數(shù)據(jù)的藕合程度高,可能會(huì)造成所有關(guān)聯(lián)的業(yè)務(wù)都要采用同一種容災(zāi)技術(shù),業(yè)務(wù)關(guān)聯(lián)松散,數(shù)據(jù)的藕合程度低,可能會(huì)針對(duì)不同的業(yè)務(wù)要求進(jìn)行區(qū)分,分別采用不同的容災(zāi)技術(shù)。
三、系統(tǒng)現(xiàn)狀
  核心業(yè)務(wù)系統(tǒng)容災(zāi)技術(shù)必須充分考慮與現(xiàn)有系統(tǒng)的配合。現(xiàn)有核心業(yè)務(wù)系統(tǒng)的應(yīng)用分布、應(yīng)用的實(shí)現(xiàn)方式、硬件設(shè)備平臺(tái)的種類、存儲(chǔ)數(shù)據(jù)量的大小、IO吞吐量的大小等,都會(huì)對(duì)容災(zāi)技術(shù)的選擇產(chǎn)生影響。
四、技術(shù)成熟度
  容災(zāi)系統(tǒng)必須采用成熟可靠的技術(shù),保證系統(tǒng)特續(xù),穩(wěn)定的運(yùn)行。該技術(shù)應(yīng)具有類似于電信業(yè)務(wù)運(yùn)營(yíng)支撐系統(tǒng)容災(zāi)建設(shè)的成功案例,不能由于技術(shù)手段的不成熟或不穩(wěn)定而增加核心業(yè)務(wù)系統(tǒng)新的風(fēng)險(xiǎn)。
五、容災(zāi)系統(tǒng)環(huán)境
  核心業(yè)務(wù)系統(tǒng)容災(zāi)技術(shù)必須考慮生產(chǎn)中心與容災(zāi)中心之間的距離,網(wǎng)絡(luò)環(huán)境等因素,不同的技術(shù)對(duì)距離,網(wǎng)絡(luò)帶寬的要求會(huì)有所不同。
六、管理維護(hù)難度
  不同的容災(zāi)技術(shù)對(duì)管理維護(hù)的要求各不相同,在同等條件下,應(yīng)采用易于管理和維護(hù)的容災(zāi)技術(shù)。
七、成本分析
  不同的容災(zāi)技術(shù)對(duì)軟硬件投資,實(shí)施維護(hù)成本的要求各不相同,在同等條件下,應(yīng)采用總體成本最小的容災(zāi)技術(shù)。

?

2.2.? 災(zāi)難事件分析

我們擬通過(guò)災(zāi)備系統(tǒng)實(shí)現(xiàn)如下災(zāi)難事件的處理。

?

2.2.1.?? 數(shù)據(jù)庫(kù)邏輯損壞

由于誤操作等原因,數(shù)據(jù)庫(kù)會(huì)出現(xiàn)表的記錄丟失或損壞情況。面對(duì)這種災(zāi)難,需要借助于快照技術(shù)將將丟失或損壞的記錄導(dǎo)入到生產(chǎn)數(shù)據(jù)庫(kù)中。

可采用ORACLE自身的機(jī)制或者CDP等快照技術(shù)事項(xiàng),整個(gè)過(guò)程生產(chǎn)數(shù)據(jù)庫(kù)不停止。對(duì)于這種災(zāi)難,可實(shí)現(xiàn)平臺(tái)RPO=0RTO=0,但對(duì)相關(guān)業(yè)務(wù)有影響。

?

2.2.2.?? 存儲(chǔ)級(jí)故障

磁盤(pán)陣列故障是一種極為嚴(yán)重的威脅,對(duì)于業(yè)務(wù)系統(tǒng)具有致命的殺傷力。IDC機(jī)房存儲(chǔ)故障將直接導(dǎo)致核心數(shù)據(jù)庫(kù)宕機(jī),導(dǎo)致相關(guān)業(yè)務(wù)系統(tǒng)的完全癱瘓。

這種情況下必須啟動(dòng)本地災(zāi)備系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)庫(kù)的遷移,或者啟動(dòng)異地災(zāi)備系統(tǒng),實(shí)現(xiàn)應(yīng)用的遷移。

對(duì)于該故障,可以采用DATAGUARD、存儲(chǔ)級(jí)復(fù)制、CDP技術(shù)加以處理。其中采用ORACLE自身的DATAGUARD機(jī)制將有分鐘級(jí)別的數(shù)據(jù)丟失和服務(wù)中斷,使用存儲(chǔ)級(jí)復(fù)制和CDP技術(shù)可實(shí)現(xiàn)數(shù)據(jù)庫(kù)不中斷運(yùn)行,而且數(shù)據(jù)丟失為零。

?

2.2.3.?? 核心網(wǎng)絡(luò)設(shè)備故障

這種情況下往往導(dǎo)致對(duì)外服務(wù)完全中斷或或者產(chǎn)能受嚴(yán)重影響,必須啟用異地災(zāi)備中心。

?

2.2.4.?? 運(yùn)營(yíng)商災(zāi)難

主要指運(yùn)營(yíng)商機(jī)房供電或者核心出口鏈路發(fā)生故障,導(dǎo)致業(yè)務(wù)系統(tǒng)全線中斷,在RTO時(shí)間內(nèi)無(wú)法修復(fù)的建議需要切換到異地災(zāi)備中心。

?

2.2.5.?? 地區(qū)性災(zāi)難

地區(qū)性災(zāi)難主要指城市級(jí)別的災(zāi)難,比如地震、海嘯等不可抗力,這種情況下往往導(dǎo)致IDC機(jī)房對(duì)外服務(wù)完全中斷,必須啟用異地的災(zāi)備中心。

?

2.3.? 理想的容災(zāi)系統(tǒng)


容災(zāi)系統(tǒng)的建立,通常需要通過(guò)分步實(shí)施,逐漸建立一套完善的系統(tǒng)容災(zāi)解決方案。理想的容災(zāi)系統(tǒng)有如下典型的特征:

一、擁有完備的本地?cái)?shù)據(jù)備份

通過(guò)相應(yīng)的備份軟件,對(duì)目前所有的計(jì)算機(jī)系統(tǒng),做好完善的數(shù)據(jù)備份,特別是做好操作系統(tǒng)備份、文件系統(tǒng)備份、數(shù)據(jù)庫(kù)系統(tǒng)文件備份、數(shù)據(jù)庫(kù)數(shù)據(jù)文件備份、相關(guān)的核心應(yīng)用程序備份;建立好完善的備份/恢復(fù)機(jī)制和遠(yuǎn)程磁帶保管機(jī)制。

這也是實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)復(fù)制容災(zāi)的基礎(chǔ),容災(zāi)中心與生產(chǎn)中心的數(shù)據(jù)初始化同步,一般都是通過(guò)磁帶備份恢復(fù)方式,實(shí)現(xiàn)一個(gè)同步起點(diǎn)。

二、存儲(chǔ)、應(yīng)用整合

存儲(chǔ)整合是指通過(guò)相關(guān)的產(chǎn)品選擇,將各服務(wù)器的數(shù)據(jù)、或應(yīng)用,通過(guò)基于一定的管理及后續(xù),實(shí)現(xiàn)數(shù)據(jù)的快照、鏡像等技術(shù),遷移到外置基于SAN的陣列庫(kù)中,通過(guò)唯一的管理接口,實(shí)現(xiàn)統(tǒng)一管理,屏蔽不同廠商陣列的差異。

三、異地實(shí)時(shí)數(shù)據(jù)同步

?????? 為了控制RTO,異地災(zāi)備中心必須采用有效的數(shù)據(jù)同步機(jī)制和主生產(chǎn)進(jìn)行實(shí)時(shí)的數(shù)據(jù)同步,確保災(zāi)難發(fā)生時(shí)業(yè)務(wù)系統(tǒng)可以進(jìn)行高效的切換,而對(duì)數(shù)據(jù)的丟失也控制在合理的水平。

四、擁有可靠的同城堡壘節(jié)點(diǎn)

同城災(zāi)備中心主要是用于防范生產(chǎn)中心機(jī)房或樓宇發(fā)生的災(zāi)難,異地災(zāi)備中心用于防范大規(guī)模區(qū)域性災(zāi)難。同城災(zāi)備中心由于其與生產(chǎn)中心處于同一個(gè)城市,可采用較好的網(wǎng)絡(luò)線路如光纖與生產(chǎn)中心進(jìn)行連接,因此數(shù)據(jù)復(fù)制和應(yīng)用切換比較容易實(shí)現(xiàn),可實(shí)現(xiàn)生產(chǎn)與災(zāi)備中心之間數(shù)據(jù)的實(shí)時(shí)復(fù)制和應(yīng)用的快速切換。

五、擁有可靠的異地容災(zāi)節(jié)點(diǎn)

異地災(zāi)備中心由于其與生產(chǎn)中心不在同一城市,災(zāi)備端與生產(chǎn)端連接的網(wǎng)絡(luò)線路帶寬和質(zhì)量存在一定的限制,一般適合于數(shù)據(jù)的異步復(fù)制,應(yīng)用系統(tǒng)的切換也需要一定的時(shí)間,因此異地災(zāi)備中心可以實(shí)現(xiàn)在業(yè)務(wù)限定的時(shí)間內(nèi)進(jìn)行恢復(fù)和可容忍丟失范圍內(nèi)的數(shù)據(jù)恢復(fù)。

?

總結(jié)

以上是生活随笔為你收集整理的灾备理论-可靠的异地灾备的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。