如何使用AHAS故障演练,实现具备韧性的系统架构?
親寶寶是一個專注于為孕期以及 0-6 歲家庭提供育兒服務的移動互聯(lián)網(wǎng)平臺。公司旨在運用科技的力量,幫助家庭更好地關愛和培育孩子。核心產(chǎn)品“親寶寶 APP”于 2013 年正式上線,以成長記錄、智能育兒助手為核心功能,為年輕家庭提供私密親子空間、線上早教、專業(yè)養(yǎng)育知識、 社區(qū)交流、母嬰商品等一站式育兒服務,截至 2019 年底,親寶寶的注冊用戶已經(jīng)超過 1 億。
2020年上半年,親寶寶用戶保持高速增長,其技術團隊也逐步發(fā)展壯大。系統(tǒng)穩(wěn)定性風險是技術團隊面臨的最大挑戰(zhàn)之一,特別是在容器技術下的微服務架構,服務間調(diào)用錯綜復雜,應用依賴眾多,對系統(tǒng)穩(wěn)定性提出了以下訴求:
? 在微服務依賴治理,需具備超時、重試、降級及預案等容錯能力。
? 容器架構模式下,需具備業(yè)務面對突發(fā)流量的彈性伸縮能力。
? 中間件或云服務在出現(xiàn)故障時,業(yè)務需要具備容錯能力。
? 應用服務在面對不穩(wěn)定網(wǎng)絡環(huán)境時,需要具備自愈能力。
如何滿足親寶寶對穩(wěn)定性的需求?
解決方案架構圖
為了快速驗證系統(tǒng)的容錯能力,親寶寶采用了阿里云應用高可用服務AHAS中的故障演練平臺解決方案:
? 通過模擬殺服務Pod、殺節(jié)點、增大Pod資源負載,觀察系統(tǒng)服務可用性,驗證集群的彈性伸縮能力是否符合預期。
? 通過模擬應用無法連接消息、緩存以及數(shù)據(jù)庫,驗證系統(tǒng)在超時設置以及預案的有效性。
? 通過模擬網(wǎng)絡不穩(wěn)定場景,驗證業(yè)務系統(tǒng)的影響范圍。
通過引入成熟、穩(wěn)定的阿里云混沌工程解決方案,親寶寶的系統(tǒng)架構在面對復雜業(yè)務下頻繁迭代時,系統(tǒng)依然具備面對失敗的容錯能力,業(yè)務表現(xiàn)得更穩(wěn)定、健壯、彈性。親寶寶的IT團隊也通過方案背后所融入的方法論,掌握了一套適合自己團隊的應對故障的預防機制,并且開始實踐演練常態(tài)化、自動化機制。
關聯(lián)產(chǎn)品
應用高可用服務 AHAS :https://www.aliyun.com/product/ahas
原文鏈接:https://developer.aliyun.com/article/781234?
版權聲明:本文內(nèi)容由阿里云實名注冊用戶自發(fā)貢獻,版權歸原作者所有,阿里云開發(fā)者社區(qū)不擁有其著作權,亦不承擔相應法律責任。具體規(guī)則請查看《阿里云開發(fā)者社區(qū)用戶服務協(xié)議》和《阿里云開發(fā)者社區(qū)知識產(chǎn)權保護指引》。如果您發(fā)現(xiàn)本社區(qū)中有涉嫌抄襲的內(nèi)容,填寫侵權投訴表單進行舉報,一經(jīng)查實,本社區(qū)將立刻刪除涉嫌侵權內(nèi)容。總結(jié)
以上是生活随笔為你收集整理的如何使用AHAS故障演练,实现具备韧性的系统架构?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 函数计算FC让游戏群采集营销数据滴水不漏
- 下一篇: ARMS为深绘智能系统保驾护航