神龙架构没那么难理解—图解世界领先的阿里云神龙架构(二)神龙出世
3 神龍出世
3.1 繼續(xù)說我們的搬磚問題
第2章中指出只要采用虛擬化和彈性計(jì)算,就代表100個(gè)勞動(dòng)力必須選擇1個(gè)管理人員,實(shí)際上只能有99個(gè)勞動(dòng)力進(jìn)行搬磚。而神龍想做到的目標(biāo)就是既然100個(gè)工人搬磚,就要全部搬磚,但同時(shí)也需要有手段來管理和控制我家和鄰居家不同時(shí)間搬磚的工人數(shù)。以上圖為例就是讓黃色的那個(gè)被抽出來負(fù)責(zé)管理工作的工人回去仍然搬磚去。
包工頭看著目前的情況想,如果要維持兩家搬磚的工人彈性靈活,就需要100個(gè)工人抽1個(gè)工人做管理工作,那如果1000個(gè)工人就需要損失10個(gè),10000個(gè)工人就需要損失100個(gè)。工程量越大則損失的勞動(dòng)力就越多,當(dāng)業(yè)務(wù)得到大規(guī)劃發(fā)展時(shí)這個(gè)損耗的問題如果能夠解決就可以大幅度的提升搬磚的效率。阿里云在神龍架構(gòu)問世前的虛擬化損耗其實(shí)比搬磚的例子更大,平均虛擬化損耗為10%左右,代表100個(gè)工人,只有90個(gè)在搬磚,剩下的10個(gè)在做搬磚管理工作。
3.2 神龍1.0的核心理念
結(jié)合實(shí)際情況包工頭決定讓原來被抽出來做管理工作的工人甲仍然回去搬他的磚去,因?yàn)樗牧獯蟮奶攸c(diǎn)意味著他本來就適合搬磚而不適合管理工作。而工人隊(duì)伍的管理工作采用項(xiàng)目經(jīng)理制,即引入專業(yè)管理人員來負(fù)責(zé)工人隊(duì)伍的管理,使工人只負(fù)責(zé)搬磚,當(dāng)然引入專業(yè)管理人員后,成本肯定是上升的,但是搬磚的勞動(dòng)力就沒有損耗了。采用項(xiàng)目經(jīng)理制后的情況如下圖所示:
需要重點(diǎn)指出的是,搬磚隊(duì)伍彈性伸縮的最小單位是1個(gè)隊(duì)伍,如果搬磚1隊(duì)忙不過來,只能要求整個(gè)搬磚2隊(duì)或者搬磚3隊(duì)整個(gè)隊(duì)伍過來幫忙,而不能說從搬磚2隊(duì)僅抽取幾個(gè)工人過來幫忙。通過這種結(jié)構(gòu)確保了每隊(duì)搬磚隊(duì)伍的勞動(dòng)力因?yàn)橛袑iT的項(xiàng)目經(jīng)理進(jìn)行管理而不會(huì)有損耗。這里先不引伸到神龍架構(gòu),因?yàn)檫€有一個(gè)重要的問題沒有提到。
3.3 異構(gòu)計(jì)算的本質(zhì)是搬磚和砌墻的結(jié)合
包工頭從自身業(yè)務(wù)的發(fā)展進(jìn)行分析,發(fā)現(xiàn)我和我的鄰居除了搬磚外還有砌墻的需求,而原先的工人全部都是擅長(zhǎng)于搬磚而沒有擅長(zhǎng)砌墻的泥瓦工,讓搬磚的工人去砌墻固然也是可以的,但是速度和質(zhì)量顯然不及專門砌墻的泥瓦工。因此包工頭的做法是,在原來的隊(duì)伍中加上泥瓦工,這樣1支隊(duì)伍就即可以搬磚又可以砌墻了,如下圖所示:
搬磚工人和泥瓦工結(jié)合的方式就叫異構(gòu),搬磚工人在搬磚的時(shí)候泥瓦工在砌墻,就叫異構(gòu)計(jì)算。
3.4 神龍1.0的特點(diǎn)總結(jié)
到這里為止雖然沒提過神龍,其實(shí)已經(jīng)把神龍1.0的特點(diǎn)全部說明白了,這里把搬磚砌墻隊(duì)伍的問題和神龍1.0的特點(diǎn)結(jié)合起來來作為神龍1.0的特點(diǎn)總結(jié)。
搬磚砌墻隊(duì)伍為了解決勞動(dòng)力損耗的問題搬磚的全部搬磚,砌墻的全部砌墻,管理工作由專門的項(xiàng)目經(jīng)理負(fù)責(zé)。反映到神龍1.0中即阿里云為了解決虛擬化損耗的問題新造出一個(gè)帶有智能芯片的專用板卡負(fù)責(zé)虛擬化調(diào)度,這塊專用板卡稱為MOC卡,外觀如下圖所示:
為了解決搬磚砌墻任務(wù)而專門成立的帶項(xiàng)目經(jīng)理的搬磚砌墻隊(duì)即是阿里云的神龍?jiān)品?wù)器如下圖所示:
業(yè)內(nèi)一般管它叫彈性裸金屬服務(wù)器。根據(jù)阿里云官方文檔:彈性裸金屬服務(wù)器(ECS Bare Metal Instance)是一種可彈性伸縮的高性能計(jì)算服務(wù),計(jì)算性能與傳統(tǒng)物理機(jī)無差別,具有安全物理隔離的特點(diǎn),分鐘級(jí)的交付周期將提供給您實(shí)時(shí)的業(yè)務(wù)響應(yīng)能力,助力您的核心業(yè)務(wù)飛速成長(zhǎng)。現(xiàn)在能夠理解了為什么計(jì)算性能與傳統(tǒng)物理機(jī)無差別,因?yàn)樯颀堅(jiān)品?wù)器就是物理機(jī),所以當(dāng)然計(jì)算性能和物理機(jī)沒有差別,此外它又可以像云服務(wù)器一樣彈性伸縮,并且交付周期為分鐘級(jí)。
一句話總結(jié)神龍1.0的特點(diǎn)就是,神龍?jiān)品?wù)器兼具了物理機(jī)和云服務(wù)器優(yōu)點(diǎn),本質(zhì)上是可以彈性伸縮的物理機(jī)并且這種物理機(jī)專門為提供云服務(wù)設(shè)計(jì)。
3.5 神龍1.0的瓶頸
回到搬磚的例子,包工頭又碰到了新問題,鄰居他自己就是一個(gè)項(xiàng)目經(jīng)理,對(duì)于搬磚和砌墻有特殊的要求,他要求一個(gè)搬磚砌墻隊(duì)內(nèi)的100個(gè)工人上午搬左邊的磚,同時(shí)砌右邊的墻;下午搬右邊的磚,同時(shí)砌左邊的墻。而目前搬磚砌墻隊(duì)的項(xiàng)目經(jīng)理沒經(jīng)歷過這種情況,不知道該怎么調(diào)配隊(duì)伍內(nèi)的工人。
這就是神龍1.0的瓶頸,虛擬化其實(shí)分成兩個(gè)方向:一個(gè)方向是虛擬化組合,把一堆物理機(jī)粘成一個(gè)大的虛擬機(jī);另一個(gè)方向是虛擬化切分,把一個(gè)物理機(jī)切成一堆小的虛擬機(jī)。神龍1.0做到了虛擬化組合,但并沒有做到虛擬化切分,在例子中即為搬磚砌墻隊(duì)的項(xiàng)目經(jīng)理只知道在自己的隊(duì)伍不夠用時(shí)叫別的隊(duì)伍來幫忙,但是自己的隊(duì)伍內(nèi)怎么去響應(yīng)我鄰居家的要求,上下午通過隊(duì)內(nèi)工人調(diào)配做到勞動(dòng)力彈性卻沒有辦法實(shí)現(xiàn)。
這個(gè)問題在神龍2.0中得到了解決。
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的神龙架构没那么难理解—图解世界领先的阿里云神龙架构(二)神龙出世的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 海量结构化数据存储技术揭秘:Tables
- 下一篇: 蚂蚁“备战”TPC-C这1年