神龙架构没那么难理解—图解世界领先的阿里云神龙架构(二)神龙出世
3 神龍出世
3.1 繼續(xù)說我們的搬磚問題
第2章中指出只要采用虛擬化和彈性計算,就代表100個勞動力必須選擇1個管理人員,實(shí)際上只能有99個勞動力進(jìn)行搬磚。而神龍想做到的目標(biāo)就是既然100個工人搬磚,就要全部搬磚,但同時也需要有手段來管理和控制我家和鄰居家不同時間搬磚的工人數(shù)。以上圖為例就是讓黃色的那個被抽出來負(fù)責(zé)管理工作的工人回去仍然搬磚去。
包工頭看著目前的情況想,如果要維持兩家搬磚的工人彈性靈活,就需要100個工人抽1個工人做管理工作,那如果1000個工人就需要損失10個,10000個工人就需要損失100個。工程量越大則損失的勞動力就越多,當(dāng)業(yè)務(wù)得到大規(guī)劃發(fā)展時這個損耗的問題如果能夠解決就可以大幅度的提升搬磚的效率。阿里云在神龍架構(gòu)問世前的虛擬化損耗其實(shí)比搬磚的例子更大,平均虛擬化損耗為10%左右,代表100個工人,只有90個在搬磚,剩下的10個在做搬磚管理工作。
3.2 神龍1.0的核心理念
結(jié)合實(shí)際情況包工頭決定讓原來被抽出來做管理工作的工人甲仍然回去搬他的磚去,因?yàn)樗牧獯蟮奶攸c(diǎn)意味著他本來就適合搬磚而不適合管理工作。而工人隊(duì)伍的管理工作采用項(xiàng)目經(jīng)理制,即引入專業(yè)管理人員來負(fù)責(zé)工人隊(duì)伍的管理,使工人只負(fù)責(zé)搬磚,當(dāng)然引入專業(yè)管理人員后,成本肯定是上升的,但是搬磚的勞動力就沒有損耗了。采用項(xiàng)目經(jīng)理制后的情況如下圖所示:
需要重點(diǎn)指出的是,搬磚隊(duì)伍彈性伸縮的最小單位是1個隊(duì)伍,如果搬磚1隊(duì)忙不過來,只能要求整個搬磚2隊(duì)或者搬磚3隊(duì)整個隊(duì)伍過來幫忙,而不能說從搬磚2隊(duì)僅抽取幾個工人過來幫忙。通過這種結(jié)構(gòu)確保了每隊(duì)搬磚隊(duì)伍的勞動力因?yàn)橛袑iT的項(xiàng)目經(jīng)理進(jìn)行管理而不會有損耗。這里先不引伸到神龍架構(gòu),因?yàn)檫€有一個重要的問題沒有提到。
3.3 異構(gòu)計算的本質(zhì)是搬磚和砌墻的結(jié)合
包工頭從自身業(yè)務(wù)的發(fā)展進(jìn)行分析,發(fā)現(xiàn)我和我的鄰居除了搬磚外還有砌墻的需求,而原先的工人全部都是擅長于搬磚而沒有擅長砌墻的泥瓦工,讓搬磚的工人去砌墻固然也是可以的,但是速度和質(zhì)量顯然不及專門砌墻的泥瓦工。因此包工頭的做法是,在原來的隊(duì)伍中加上泥瓦工,這樣1支隊(duì)伍就即可以搬磚又可以砌墻了,如下圖所示:
搬磚工人和泥瓦工結(jié)合的方式就叫異構(gòu),搬磚工人在搬磚的時候泥瓦工在砌墻,就叫異構(gòu)計算。
3.4 神龍1.0的特點(diǎn)總結(jié)
到這里為止雖然沒提過神龍,其實(shí)已經(jīng)把神龍1.0的特點(diǎn)全部說明白了,這里把搬磚砌墻隊(duì)伍的問題和神龍1.0的特點(diǎn)結(jié)合起來來作為神龍1.0的特點(diǎn)總結(jié)。
搬磚砌墻隊(duì)伍為了解決勞動力損耗的問題搬磚的全部搬磚,砌墻的全部砌墻,管理工作由專門的項(xiàng)目經(jīng)理負(fù)責(zé)。反映到神龍1.0中即阿里云為了解決虛擬化損耗的問題新造出一個帶有智能芯片的專用板卡負(fù)責(zé)虛擬化調(diào)度,這塊專用板卡稱為MOC卡,外觀如下圖所示:
為了解決搬磚砌墻任務(wù)而專門成立的帶項(xiàng)目經(jīng)理的搬磚砌墻隊(duì)即是阿里云的神龍云服務(wù)器如下圖所示:
業(yè)內(nèi)一般管它叫彈性裸金屬服務(wù)器。根據(jù)阿里云官方文檔:彈性裸金屬服務(wù)器(ECS Bare Metal Instance)是一種可彈性伸縮的高性能計算服務(wù),計算性能與傳統(tǒng)物理機(jī)無差別,具有安全物理隔離的特點(diǎn),分鐘級的交付周期將提供給您實(shí)時的業(yè)務(wù)響應(yīng)能力,助力您的核心業(yè)務(wù)飛速成長。現(xiàn)在能夠理解了為什么計算性能與傳統(tǒng)物理機(jī)無差別,因?yàn)樯颀堅品?wù)器就是物理機(jī),所以當(dāng)然計算性能和物理機(jī)沒有差別,此外它又可以像云服務(wù)器一樣彈性伸縮,并且交付周期為分鐘級。
一句話總結(jié)神龍1.0的特點(diǎn)就是,神龍云服務(wù)器兼具了物理機(jī)和云服務(wù)器優(yōu)點(diǎn),本質(zhì)上是可以彈性伸縮的物理機(jī)并且這種物理機(jī)專門為提供云服務(wù)設(shè)計。
3.5 神龍1.0的瓶頸
回到搬磚的例子,包工頭又碰到了新問題,鄰居他自己就是一個項(xiàng)目經(jīng)理,對于搬磚和砌墻有特殊的要求,他要求一個搬磚砌墻隊(duì)內(nèi)的100個工人上午搬左邊的磚,同時砌右邊的墻;下午搬右邊的磚,同時砌左邊的墻。而目前搬磚砌墻隊(duì)的項(xiàng)目經(jīng)理沒經(jīng)歷過這種情況,不知道該怎么調(diào)配隊(duì)伍內(nèi)的工人。
這就是神龍1.0的瓶頸,虛擬化其實(shí)分成兩個方向:一個方向是虛擬化組合,把一堆物理機(jī)粘成一個大的虛擬機(jī);另一個方向是虛擬化切分,把一個物理機(jī)切成一堆小的虛擬機(jī)。神龍1.0做到了虛擬化組合,但并沒有做到虛擬化切分,在例子中即為搬磚砌墻隊(duì)的項(xiàng)目經(jīng)理只知道在自己的隊(duì)伍不夠用時叫別的隊(duì)伍來幫忙,但是自己的隊(duì)伍內(nèi)怎么去響應(yīng)我鄰居家的要求,上下午通過隊(duì)內(nèi)工人調(diào)配做到勞動力彈性卻沒有辦法實(shí)現(xiàn)。
這個問題在神龍2.0中得到了解決。
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的神龙架构没那么难理解—图解世界领先的阿里云神龙架构(二)神龙出世的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海量结构化数据存储技术揭秘:Tables
- 下一篇: 蚂蚁“备战”TPC-C这1年