阿里云重磅发布云原生裸金属方案:裸金属+容器,解锁云计算的新方式
作者 | 阿里云原生
在 6 月 9 日 2020 阿里云線上峰會上,阿里云智能基礎(chǔ)產(chǎn)品事業(yè)部高級研究員蔣江偉重磅發(fā)布了云原生裸金屬方案。
新一代容器服務(wù) ACK,可以將最新神龍彈性裸金屬實例的強(qiáng)大性能發(fā)揮得淋漓盡致,具備極致性能、高效調(diào)度、全面安全的特點(diǎn):
-
新一代神龍架構(gòu)具備業(yè)界第一的 I/O 轉(zhuǎn)發(fā)能力,提供最高 100G 網(wǎng)絡(luò)帶寬;阿里云高速 Terway 容器網(wǎng)絡(luò)通過網(wǎng)卡直通和數(shù)據(jù)平面加速,延遲下降 30%;
-
第 7 代實例最大支持 192 個 vCPU。ACK 智能 CPU 調(diào)度可以輕松釋放強(qiáng)大算力,無需應(yīng)用調(diào)整可以實現(xiàn) QPS 20~30% 提升;結(jié)合 ENI 網(wǎng)卡密度提升,可以縮減 50% 的計算成本;
-
彈性裸金屬實例支持阿里云安全容器,提升端到端安全隔離能力,與開源方案相比性能提升 30%,也支持阿里云首發(fā)機(jī)密計算容器,基于軟硬一體技術(shù)有效保護(hù)數(shù)據(jù)隱私。
在阿里巴巴內(nèi)部,神龍架構(gòu)已大規(guī)模應(yīng)用于淘寶、天貓、菜鳥等業(yè)務(wù),解決了高峰值下的業(yè)務(wù)性能和穩(wěn)定性問題。在外部,尤其是在這次疫情影響下,很多企業(yè)面臨快速擴(kuò)容的壓力,如在線教育行業(yè),通過阿里云容器+神龍方案,企業(yè)可以從容應(yīng)對流量突增的難題。
視源股份(CVTE)的希沃系列教育平穩(wěn)應(yīng)對疫情期間指數(shù)級增長的課堂流量,視源電子運(yùn)維負(fù)責(zé)人許坤豐稱,“疫情之下,希沃課堂作為教育信息化應(yīng)用和服務(wù)工具提供商,免費(fèi)向全國師生開放希沃云課堂在線直播方案。不久前,全國超過 30 萬教師使用希沃云課堂開課,共開設(shè)超過 200 萬節(jié)課程。面對指數(shù)級增長的流量,我們在阿里云容器服務(wù) ACK 上使用神龍服務(wù)器和 ECI,順利完成擴(kuò)容,讓系統(tǒng)得以正常運(yùn)行。ECI 的簡單易用,海量節(jié)點(diǎn)的特性加上神龍服務(wù)器高性能,零抖動的特點(diǎn),極大緩解了擴(kuò)容的壓力,讓我們把更多精力放在產(chǎn)品本身,給全國老師和學(xué)生提供更好的服務(wù)。”
云計算開源產(chǎn)業(yè)聯(lián)盟上周公布了“云原生應(yīng)用十大優(yōu)秀案例”評選結(jié)果,阿里云支持的申通通用云原生計算平臺順利入選。申通基于云原生裸金屬方案完成遷云,實現(xiàn)了圍繞快遞包裹生命周期的高效管理,平穩(wěn)度過 雙11 業(yè)務(wù)高峰。
云計算開源產(chǎn)業(yè)聯(lián)盟對申通通用云原生計算平臺評價稱“該平臺解決了傳統(tǒng)應(yīng)用升級緩慢、架構(gòu)臃腫、不能快速迭代等問題,通過云原生架構(gòu)體系,在成本、穩(wěn)定性、效率、賦能業(yè)務(wù)等四個維度獲得顯著成效。目前核心業(yè)務(wù)系統(tǒng)已經(jīng)在云上完成流量承接,每天處理訂單量在千萬級別,處理物流軌跡在億級別,每天產(chǎn)生的數(shù)據(jù)量在 1T,使用 1300+ 個計算節(jié)點(diǎn)來實時處理業(yè)務(wù)。”
神龍架構(gòu)是容器的最佳載體
2017 年 10 月,阿里云在全球率先推出了同時融合物理機(jī)和虛擬機(jī)特性的“跨界”云服務(wù)器——彈性裸金屬服務(wù)器神龍 X-Dragon,它采用了自主研發(fā)的虛擬化 2.0 技術(shù),兼具“虛擬機(jī)的心臟”和“物理機(jī)的肌肉”,被認(rèn)為是云計算領(lǐng)域的新物種。從 2017 年發(fā)布第一代神龍架構(gòu)開始,歷經(jīng)了軟件虛擬化、通用硬件虛擬化、專用硬件芯片虛擬化三個階段后,第三代神龍架構(gòu)實現(xiàn)了裸金屬服務(wù)器、ECS 虛擬機(jī),彈性容器實例 ECI 等多種計算平臺的架構(gòu)統(tǒng)一和全面優(yōu)化。
蔣江偉在演講中也提到,客戶普遍有個共識,那就是容器與物理服務(wù)器的結(jié)合是最佳搭檔。但是普通物理服務(wù)器天然具有一些缺陷,比如運(yùn)維復(fù)雜度高,缺乏彈性。而以神龍架構(gòu)為基礎(chǔ)的裸金屬服務(wù)器,搭配容器服務(wù) ACK,不僅提供非常好的性能,同時具備虛擬機(jī)的運(yùn)維靈活性,正好彌補(bǔ)了物理服務(wù)器的彈性缺陷,對于構(gòu)建容器環(huán)境而言,裸金屬是更好的選擇。
據(jù)蔣江偉介紹,云原生裸金屬具備極致的彈性、高效的調(diào)度能力和更全面的安全能力。在普通的應(yīng)用場景下,基于神龍架構(gòu)的容器服務(wù)ACK與自建容器相比,可以實現(xiàn)QPS提升30%,計算成本下降50%,容器安全性能提升30%。
對于線下傳統(tǒng)物理機(jī)服務(wù)器,企業(yè)客戶最大的痛點(diǎn)就是缺乏彈性,運(yùn)維復(fù)雜,無法應(yīng)對快速發(fā)展的業(yè)務(wù)需求。神龍裸金屬服務(wù)器,具備虛擬機(jī)的體驗,物理機(jī)的性能。擴(kuò)容交付周期幾周縮短到分鐘,與虛擬機(jī)相比性能“零損耗”、“零抖動”,與傳統(tǒng)物理機(jī)相比性價比提升 20% ,是用戶上云的最佳選擇。
釘釘以前 100% 部署在普通物理機(jī)上,疫情突發(fā)之后,政府、企業(yè)和學(xué)校對在線協(xié)作的需求猛增。通過云上神龍裸金屬+容器彈性部署方案,快速地實現(xiàn)了釘釘業(yè)務(wù)應(yīng)用 10 萬核擴(kuò)容需求;借助神龍+容器的超高性能支撐釘釘扛住了有史以來最大的流量洪峰。
此外,社區(qū)版本 K8s 容器調(diào)度技術(shù)存在一定局限,無法充分使用神龍裸金屬服務(wù)器強(qiáng)大的算力。應(yīng)用在多 CPU 核心場景下,可能會引起資源爭搶、CPU 頻繁切換等情況。通過開啟容器服務(wù) ACK 的智能 CPU 調(diào)度,可以提升緩存的命中率、減少 CPU 中斷和切換次數(shù),有效提升性能,在不增加硬件資源的情況下性能提升 20%,QPS 從 25 萬提升到 30 萬。
容器服務(wù) ACK 不但支持對 CPU 的高效調(diào)度,還新增了對業(yè)界最強(qiáng)算力 AI 芯片 - 含光 800 的多核調(diào)度支持,可以**成倍提升?**AI 業(yè)務(wù)資源利用率和性價比。阿里自研的含光 800 芯片具備強(qiáng)大的應(yīng)用算力,在淘寶的拍立淘場景中,對商品庫每天新增 10 億商品圖片,使用傳統(tǒng) GPU 算力識別需要 1 小時,使用含光 800 后可縮減至 5 分鐘。對于強(qiáng)大的含光 NPU 芯片,阿里云容器服務(wù) ACK 獨(dú)創(chuàng)了面向容器的虛擬化和共享能力,充分發(fā)揮含光 800 多核資源,把多種業(yè)務(wù)精確調(diào)度到同一含光 800 芯片,充分利用計算資源,顯著降低計算成本!
傳統(tǒng)企業(yè),尤其是一些大型企業(yè),對從私有數(shù)據(jù)中心遷移到公有云上并不放心。其中數(shù)據(jù)安全問題是首要關(guān)切,需要獨(dú)享使用物理機(jī)才會有安全感。云原生裸金屬方案,結(jié)合阿里云安全沙箱容器技術(shù),提供從基礎(chǔ)設(shè)施到應(yīng)用運(yùn)行時端到端安全,非常適合對隱私和隔離要求較高的應(yīng)用場景,而且與開源方案相比性能提升 30%。
阿里云此次首發(fā)機(jī)密計算容器,基于軟硬一體技術(shù)實現(xiàn)全鏈路加密,有效解決數(shù)據(jù)泄露、非法數(shù)據(jù)訪問等問題,可以應(yīng)用在區(qū)塊鏈、金融交易、基因計算等業(yè)務(wù)場景中。
云計算的下一站,是云原生
神龍是面向云原生設(shè)計的新一代云基礎(chǔ)設(shè)施架構(gòu),同時支持裸金屬服務(wù)器、ECS 虛擬機(jī),ECI 彈性容器實例等多種計算形態(tài)。神龍架構(gòu)采用軟硬一體設(shè)計,可以將網(wǎng)絡(luò)和存儲的轉(zhuǎn)發(fā)任務(wù)卸載到神龍芯片上,避免了底層資源爭搶而導(dǎo)致的 ECS 虛擬機(jī)性能波動。第三代神龍架構(gòu)還引入硬件級別 QoS 能力,為客戶關(guān)鍵業(yè)務(wù)帶來更強(qiáng)的保障。基于神龍架構(gòu)的 ECI 彈性容器實例,性能優(yōu)于虛擬機(jī)中運(yùn)行的相同規(guī)格 Docker 容器;具備極致的彈性能力,可以在一分鐘內(nèi)擴(kuò)容 1000 業(yè)務(wù)容器實例。
客戶可以在一個 ACK K8s 集群中劃分不同節(jié)點(diǎn)池統(tǒng)一管理彈性裸金屬實例,ECS 虛擬機(jī)實例和彈性容器實例。根據(jù)應(yīng)用負(fù)載特性,可以充分優(yōu)化計算效率、提升資源利用率、降低計算成本。對于需要極致性能和強(qiáng)安全隔離場景,用戶可以采用裸金屬實例;對于存在明顯業(yè)務(wù)峰谷的場景,虛擬機(jī)實例可以提供更靈活的彈性。而彈性容器實例可以更好應(yīng)對突發(fā)業(yè)務(wù)流量,提供免運(yùn)維的用戶體驗。
容器服務(wù) ACK 已經(jīng)成為企業(yè)云原生操作系統(tǒng),與 EDAS 微服務(wù)架構(gòu),ARMS 端到端可觀測能力全面集成,全面提升 IT 敏捷性,為企業(yè)數(shù)字化轉(zhuǎn)型提速。
課程推薦
為了更多開發(fā)者能夠享受到 Serverless 帶來的紅利,這一次,我們集結(jié)了 10+ 位阿里巴巴 Serverless 領(lǐng)域技術(shù)專家,打造出最適合開發(fā)者入門的 Serverless 公開課,讓你即學(xué)即用,輕松擁抱云計算的新范式——Serverless。
點(diǎn)擊即可免費(fèi)觀看課程:https://developer.aliyun.com/learning/roadmap/serverless
“阿里巴巴云原生關(guān)注微服務(wù)、Serverless、容器、Service Mesh 等技術(shù)領(lǐng)域、聚焦云原生流行技術(shù)趨勢、云原生大規(guī)模的落地實踐,做最懂云原生開發(fā)者的公眾號。”
總結(jié)
以上是生活随笔為你收集整理的阿里云重磅发布云原生裸金属方案:裸金属+容器,解锁云计算的新方式的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenYurt 开箱测评 | 一键让原
- 下一篇: Arthas watch 命令使用指南