亚马逊云科技造芯
亞馬遜云科技造芯
二十五年前,亞馬遜是一個(gè)賣書的公司;十五年前,亞馬遜是一個(gè)電商公司。
云計(jì)算公司
事實(shí)上,從2006年開始,亞馬遜就開始考慮在云計(jì)算領(lǐng)域的戰(zhàn)略布局了,成立了亞馬遜云科技AWS。通過十幾年的發(fā)展,這部分業(yè)務(wù)已經(jīng)成為了驅(qū)動(dòng)亞馬遜下一個(gè)階段發(fā)展的最重要的力量。
這里的驅(qū)動(dòng)有兩個(gè)方面的含義,一個(gè)是財(cái)務(wù)方面,另外一個(gè)是技術(shù)方面。
亞馬遜在過去的很長一段時(shí)間里都是持續(xù)虧損的,但在2000年之后就開始慢慢的扭虧為盈。這里面很重要的原因,就是高附加值高利潤的云計(jì)算的逐漸興起。
經(jīng)過將近20年的發(fā)展,2020年云科技部門雖然收入只占亞馬遜總收入的12%,但利潤有135億美元。公司有將近60%的稅前利潤是由亞馬遜云科技提供的。
從技術(shù)方面看,亞馬遜云科技是全球當(dāng)之無愧的云計(jì)算第一大廠。根據(jù)知名咨詢機(jī)構(gòu)Gartner發(fā)布的“全球云技術(shù)設(shè)施和平臺服務(wù)魔力象限”這份報(bào)告,亞馬遜云科技已經(jīng)連續(xù)11年在領(lǐng)導(dǎo)力象限排名第一。
科技大廠發(fā)展到一定階段,自研芯片就成了必然的選擇。國外的谷歌微軟如此,國內(nèi)的阿里騰訊也如此。而這波風(fēng)潮的引領(lǐng)者,果然還是亞馬遜。
亞馬遜自研芯片這步棋,走的無比正確。芯片也幫助從一個(gè)To C的電商,逐步轉(zhuǎn)型并且顛覆一個(gè)To B的行業(yè)。
亞馬遜云計(jì)算做的好好的,干嘛要做芯片呢?這個(gè)就要從AWS成立十年之后, 2016年開始說起。
源起:第一座高峰
2016年,亞馬遜收購了一個(gè)位于以色列的名叫Annapurna Labs的公司。Annapurna安娜普爾納,喜馬拉雅山脈的一座高山,海拔8091米,也是世界第十高峰。
安娜普爾納峰是人類登上的第一座超過8000米的高山。很有代表意義的是,對Annapurna Labs的收購,也是亞馬遜云科技在造芯之路上“征服”的第一座山。為了這次收購,花了3.5億美元,但是從現(xiàn)在這個(gè)穿越的視角往回看,這3.5億美元就撬動(dòng)了超過4000億美元的全球云計(jì)算市場。
事實(shí)上,兩家公司在收購之前就已經(jīng)有很密切的合作了。亞馬遜云科技的當(dāng)家技術(shù)叫做Amazon EC2,Elastic Compute Cloud的縮寫,中文叫做彈性云計(jì)算。一個(gè)云計(jì)算的基礎(chǔ)性平臺,之前說的那些計(jì)算、存儲、人工智能等等應(yīng)用,都是運(yùn)行在這個(gè)平臺上的一個(gè)個(gè)實(shí)例(instance)。
可以把Amazon EC2看成是超市里的貨架,實(shí)例就是貨架上的商品,如各種蔬菜水果和日用百貨。
這兩家公司主要的合作方向,就是想辦法不斷迭代提升Amazon EC2 這個(gè)平臺的性能和靈活性。但是當(dāng)時(shí)的合作還并沒有深入到云數(shù)據(jù)中心的兩大核心:基礎(chǔ)設(shè)施架構(gòu)和CPU。
不過AWS一直想玩一把大的,做數(shù)據(jù)中心芯片,基于Arm架構(gòu)的數(shù)據(jù)中心芯片。亞馬遜的大神工程師James Hamilton早在2014年就有意無意地說過,基于Arm的數(shù)據(jù)中心芯片的研發(fā)速度太慢,性能也無法和x86芯片相比。
言者無心聽者有意,這些話就引發(fā)了業(yè)界極大的好奇,大家都在揣測難不成亞馬遜要自己做芯片了嗎,這個(gè)螃蟹在之前從來也沒人吃過。
在2016年的re:Invent大會(huì)上,James Hamilton就從口袋里拿出了亞馬遜云科技自研的第一顆數(shù)據(jù)中心芯片。其實(shí)并不是CPU處理器,而是一個(gè)網(wǎng)絡(luò)芯片,主要用來支持2x25G以太網(wǎng)的數(shù)據(jù)包處理。
已經(jīng)足夠震撼了。業(yè)界這個(gè)時(shí)候才意識到,云廠商已經(jīng)不滿足于去買“貨架”了,而是去設(shè)計(jì)研發(fā)貨架了。這樣的好處非常明顯,就是能很好的結(jié)合商店的情況,如可以充分利用空間、如果量大的話也能極大降低成本。
Nitro與Graviton:第二、三座高峰
一年之后,亞馬遜云科技發(fā)布了新一代的Amazon EC2 C5實(shí)例。和前一代的產(chǎn)品相比,C5實(shí)現(xiàn)了25% ~ 50%的能效提升,引入了對裸金屬的支持。這些提升背后,就是Amazon Nitro帶來的系統(tǒng)重構(gòu)。Nitro系統(tǒng)一直發(fā)展進(jìn)化到現(xiàn)在,里面的很多概念啟發(fā)和影響了現(xiàn)在大火的DPU。所以Nitro就是亞馬遜造芯之路的第二個(gè)重要的里程碑。
James Hamilton的ARM處理器之夢,終于在2018年變成了現(xiàn)實(shí)。在當(dāng)年的re:Invent大會(huì)上,發(fā)布了Amazon Graviton處理器,在2020年推出了第二代、在今年推出了第三代,每代都取得了極大的飛躍和提升。Graviton是基于ARM架構(gòu)的服務(wù)器CPU芯片,實(shí)現(xiàn)了大規(guī)模的商業(yè)化應(yīng)用,意義是不言而喻的。
接下來就以Graviton和Nitro這兩個(gè)標(biāo)志性的芯片項(xiàng)目為例,一起深入的看看亞馬遜云科技造芯背后的本質(zhì)邏輯。
Graviton:要玩,就玩把大的
x86服務(wù)器芯片其實(shí)起源于客戶端芯片,逐漸往里面增加服務(wù)器芯片需要的功能。亞馬遜沒有這樣的包袱,就專注于服務(wù)器芯片本身,就看準(zhǔn)了基于ARM架構(gòu)的服務(wù)器CPU。
James Hamilton就在博客里說過很多次,雖然很多公司都失敗了,但仍然覺得Arm服務(wù)器CPU是不可阻擋的趨勢。
結(jié)果賭對了。
Graviton2采用7納米工藝制造,集成了300億個(gè)晶體管。片上集成了64個(gè)ARM N1內(nèi)核,支持64K的一級緩存、1M二級緩存、32M三級緩存,64個(gè)內(nèi)核的內(nèi)部總線帶寬達(dá)到了2TB/s,并且在服務(wù)器安全性上做了針對性的優(yōu)化,如加密的DRAM、以及沒有多線程的相互獨(dú)立的CPU內(nèi)核設(shè)計(jì)等等。
再用小商店的例子,Graviton2可以看做是亞馬遜云科技給自己量身定做的新一代貨架;還在貨架上進(jìn)了很多新貨,也就是Graviton2的EC2實(shí)例,如針對通用計(jì)算的M6g、針對存儲的R6g、針對計(jì)算應(yīng)用的C6g等等。這里的小g指的就是基于Graviton2的ARM架構(gòu)實(shí)例,云計(jì)算領(lǐng)域的另外一個(gè)重要的突破。原來貨架上擺的都是x86的貨,現(xiàn)在終于有基于ARM的貨了。
不僅有貨,貨還不錯(cuò)。除了性能比前一代的大幅提升之外,功耗、成本都極大的降低了。從性價(jià)比的角度,就是單位性能的成本(price/performance),基于Graviton2的這些實(shí)例比x86實(shí)例提升了40%。
2021年底發(fā)布的Graviton3芯片,又把性能和性價(jià)比提升了一個(gè)新的高度,但是采用了一種所有人都沒有想到的方式。
從晶體管和工藝來看,Graviton3集成了550億個(gè)晶體管,幾乎是上一代的一倍。另外一個(gè)芯片大神Jim Keller曾經(jīng)說過,單純追求晶體管數(shù)量沒有太多意義,如何把這些多出來的晶體管用起來。
當(dāng)商店面積擴(kuò)大一倍的時(shí)候,該增加更多的貨架擺放更多商品,還是重新改造商店讓動(dòng)線更加合理,或者開辟出單獨(dú)的區(qū)域作為咖啡館,讓顧客在逛街之后能有休息的地方,這些其實(shí)和設(shè)計(jì)芯片有很多共通之處。
在Graviton3發(fā)布之前,很多人預(yù)測內(nèi)核數(shù)量會(huì)提升到128個(gè)甚至更多,或者主頻能提升2-30%。結(jié)果發(fā)布之后大家都傻了,Graviton3仍然保留了64個(gè)ARMv8內(nèi)核,主頻和前一代2.5GHz相比也幾乎保持不變,只有2.6GHz。
這多出來的250億個(gè)晶體管去哪了呢?
答案是,都去用來提升并行度、以及提升內(nèi)存帶寬了。比如,每個(gè)Graviton3內(nèi)核的內(nèi)存帶寬比前一代增加了50%,非常大的提升。
好像商店原來每個(gè)小時(shí)只能進(jìn)100個(gè)人,其他人只能在外面排隊(duì)等著。但現(xiàn)在面積大了,每小時(shí)可以讓150個(gè)人進(jìn)來買東西。當(dāng)然還優(yōu)化了整個(gè)商店的購物流程和購物體驗(yàn),讓每個(gè)人購物的時(shí)間都縮短了,這就進(jìn)一步提升了效率。
所以根據(jù)亞馬遜云科技給出的數(shù)據(jù),在沒有增加內(nèi)核數(shù)量和頻率的情況下,Graviton3的性能相比前一代提升了至少25%,功耗降低了高達(dá)60%。
不僅如此,商店里還開咖啡館了,Graviton3里還集成了機(jī)器學(xué)習(xí)的硬件加速單元,對于這些應(yīng)用可以實(shí)現(xiàn)3倍的性能提升。
正因?yàn)橛辛烁咚懔偷凸牡闹С?#xff0c;亞馬遜云科技還推出了新型的C7g實(shí)例,適用于高性能計(jì)算、電子設(shè)計(jì)自動(dòng)化EDA、分布式分析等等這些基于CPU的計(jì)算密集型負(fù)載,也是首個(gè)支持DDR5的云計(jì)算實(shí)例。要知道這些計(jì)算密集型的應(yīng)用原本都是x86 CPU絕對控制的領(lǐng)域,這也是基于Arm架構(gòu)的CPU在云數(shù)據(jù)中心里又邁出的一大步。
Nitro:
真正重要的地方,是看不見的地方
Graviton再牛,只是一個(gè)CPU,背后需要有一整套基礎(chǔ)設(shè)施去保障支持高效運(yùn)行。這個(gè)就是Amazon Nitro系統(tǒng)。不是一個(gè)單獨(dú)的芯片,而是多個(gè)芯片和板卡組成的基礎(chǔ)架構(gòu)。
究竟什么是基礎(chǔ)設(shè)施架構(gòu)呢?再回到商店,這里面的水電管線、物流倉儲、上貨下貨整個(gè)流程都是支撐商店正常運(yùn)轉(zhuǎn)的基礎(chǔ)設(shè)施架構(gòu)。
去商店是為了買東西的,如果沒有這些背后的基礎(chǔ)設(shè)施,壓根沒貨可買,或者連商店門都打不開。數(shù)據(jù)中心也是如此,用戶希望用就是服務(wù)器或者虛擬機(jī),但要處理很多網(wǎng)絡(luò)通信、數(shù)據(jù)存儲、安全管理等等技術(shù)問題,這些基礎(chǔ)設(shè)施對于用戶來說是看不見的。
這些服務(wù)和設(shè)備可能來自很多不同的廠商,作為用戶,特別不想一個(gè)個(gè)的去做兼容和適配。需要一個(gè)虛擬化的方法,把這些底層的服務(wù)和設(shè)備都隱藏起來,給用戶虛擬出來一個(gè)統(tǒng)一的機(jī)器和接口,可以直接在上面開發(fā)。
這個(gè)特別像很多便利店,雖然背后的物流倉儲等等都是五花八門的,但在外面看起來都是一樣的,購物體驗(yàn)也是類似的。
所以這就是Nitro產(chǎn)生的最本質(zhì)原因,已經(jīng)成為了驅(qū)動(dòng)所有EC2實(shí)例的平臺,可以實(shí)現(xiàn)存儲訪問、加密、監(jiān)控、實(shí)例配置等等所有工作。能把數(shù)據(jù)中心的那些計(jì)算網(wǎng)絡(luò)存儲等基礎(chǔ)設(shè)施都卸載掉,釋放出寶貴的內(nèi)核資源,虛擬出來一個(gè)統(tǒng)一的用戶接口。不管底層用的是x86 CPU還是 Arm CPU,對于用戶來說都沒有區(qū)別。還有專門的安全系統(tǒng)和芯片,這樣主機(jī)之外的任何系統(tǒng)和人,都沒辦法登陸或者讀取基于Nitro的實(shí)例內(nèi)存。
這個(gè)不就是現(xiàn)在大火的DPU想要干的事,其實(shí)Nitro已經(jīng)做了很久了。
在2021年的re:Invent大會(huì)上,亞馬遜云科技發(fā)布了新一代的Nitro SSD,也把不同廠商的SSD都隱藏和處理掉,從根本上解決了不同廠商的產(chǎn)品對數(shù)據(jù)中心以及客戶帶來的適配性的影響。
小結(jié)
在梳理這些內(nèi)容的時(shí)候,有兩個(gè)最大的感觸。第一,造芯不僅是亞馬遜云科技選擇的一條正確的道路,更是一條必由之路。雖然這條路上很多公司都倒下了,但活下來的都取得了巨大的成功。為什么很多科技巨頭公司發(fā)展到最后,都會(huì)不約而同的選擇自研芯片。
第二個(gè)感悟,就是沒有選擇只做一個(gè)芯片,而是做了一個(gè)很大的芯片布局,在領(lǐng)域?qū)S玫幕A(chǔ)上不斷迭代優(yōu)化。也沒有盲目的追求性能,而是結(jié)合自己的需求,在性能功耗成本等等因素里做了對于自己最優(yōu)的選擇,這個(gè)也能為很多想要自研芯片的公司提供很好的借鑒。
參考鏈接:
https://www.163.com/dy/article/GUP1KBFU0531NIP0.html
參考鏈接:
https://www.163.com/dy/article/GUP1KBFU0531NIP0.html
總結(jié)
- 上一篇: 晶体管逻辑芯片设计微缩图形化
- 下一篇: 光刻机技术创新