异构计算:软硬件结合全栈助力AI大爆发
9月20日上午,杭州云棲小鎮(zhèn)E1-2會場,備受業(yè)界關(guān)注的2018年杭州云棲大會異構(gòu)計(jì)算專場召開。
近年來,人工智能持續(xù)爆發(fā),對算力提出了更高的要求。異構(gòu)計(jì)算作為大計(jì)算時(shí)代的解決方案,意在打破傳統(tǒng)通用計(jì)算的限制,融合不同指令集和體系架構(gòu)的計(jì)算單元,完美支持大計(jì)算場景。
讓每一個(gè)芯片都發(fā)揮最大效能
首先,阿里云彈性計(jì)算負(fù)責(zé)人,阿里云研究員余鋒,帶來了精彩的開場。余鋒以攝影來打開話題:每一個(gè)鏡頭都會有特別的定位,在某個(gè)場景下合適但是另外場景會力不從心,異構(gòu)計(jì)算的精髓也是如此,即讓每一個(gè)芯片都發(fā)揮最大效能,揚(yáng)長避短。
?
余鋒說:異構(gòu)計(jì)算帶來的計(jì)算效率提升是指數(shù)級的,但是需要有配套工具,基礎(chǔ)設(shè)施等等。阿里云正在逐漸讓這個(gè)門檻變低,并且和業(yè)內(nèi)一起構(gòu)建技術(shù)生態(tài),讓異構(gòu)計(jì)算普惠行業(yè),幫助合作伙伴和客戶不斷創(chuàng)新。
GN6實(shí)例 F3實(shí)例全面商業(yè)化
議題階段,首先登場的是阿里云高級產(chǎn)品專家潘岳。潘岳首先介紹了正在全面商業(yè)化推進(jìn)的GN6實(shí)例和F3實(shí)例。GN6實(shí)例搭載NVIDIA Volta架構(gòu)的Tesla V100計(jì)算卡,相對于上一代產(chǎn)品可以提供12倍的運(yùn)算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平臺的F3實(shí)例搭載Xilinx 16nm Virtex UltraScale+器件VU9P,對比上一代產(chǎn)品,邏輯容量增加4倍,DSP能力提升8倍。
?
兩大平臺:昊天 和 舜天,全面助力企業(yè)創(chuàng)新
隨后,潘岳首次揭秘了阿里云異構(gòu)計(jì)算兩大平臺:昊天EGS平臺和舜天FaaS平臺;分別對應(yīng)異構(gòu)計(jì)算領(lǐng)域兩大熱門芯片方案:GPU和FPGA。潘岳指出,阿里云異構(gòu)計(jì)算平臺技術(shù)在阿里巴巴內(nèi)部已經(jīng)完成和多項(xiàng)業(yè)務(wù)的順利融合,歷經(jīng)大范圍高壓測試,已然非常成熟。除此之外,異構(gòu)計(jì)算全系產(chǎn)品與阿里云生態(tài)深度無縫融合,可以和傳統(tǒng)的通用計(jì)算共用云上的全套服務(wù)。
?
在改善用戶使用體驗(yàn)上,阿里云異構(gòu)產(chǎn)品持續(xù)提供多種工具,來讓異構(gòu)產(chǎn)品更易用,這其中包括了方便開發(fā)部署的容器鏡像工具,實(shí)時(shí)監(jiān)測GPU狀態(tài)的運(yùn)維工具,以及神經(jīng)網(wǎng)絡(luò)框架優(yōu)化的增值服務(wù)等。此后,潘岳分享了阿里云FPGA云服務(wù)器落地的業(yè)務(wù)場景。最后,在異構(gòu)生態(tài)建設(shè)上,潘岳強(qiáng)調(diào),阿里云積極引入國內(nèi)外眾多的解決方案供應(yīng)商,共同構(gòu)建完善異構(gòu)生態(tài)體系,為企業(yè)客戶提供高性能的加速解決方案。
昊天平臺揭秘
論壇的第二個(gè)議題由阿里云資深技術(shù)專家龍欣帶來,對昊天EGS平臺進(jìn)行了詳細(xì)的剖析。龍欣指出阿里云異構(gòu)計(jì)算的GPU云服務(wù),在算力水平擴(kuò)展趨勢背景下,已經(jīng)從GPU加速器的單點(diǎn)突破,向全面的平臺體系演進(jìn)。
?
今天的演講第一次披露了阿里云昊天EGS平臺的服務(wù)體系:昊天平臺在集群計(jì)算上,為不同規(guī)模的客戶提供了從GPU集群運(yùn)維監(jiān)控,到底層CUDA驅(qū)動,再到中間框架加速層快速一鍵部署,和GPU集群分布式業(yè)務(wù)層定制化調(diào)優(yōu)的全面專業(yè)服務(wù)。演講還分享了昊天平臺在底層基礎(chǔ)設(shè)施層的技術(shù)架構(gòu):GPU虛擬機(jī)的熱升級技術(shù)、與AMD聯(lián)合開發(fā)的公共云首個(gè)基于SRIOV的GPU熱遷移技術(shù)、神龍GPU技術(shù)與超級計(jì)算GPU集群技術(shù)。
成熟客戶案例立體呈現(xiàn)
來自微博的資深技術(shù)專家黃波,從客戶的角度,詳細(xì)介紹了基于阿里云異構(gòu)計(jì)算平臺的深度學(xué)習(xí)案例。同時(shí),黃波先生還從自身體驗(yàn)出發(fā),總結(jié)了云端深度學(xué)習(xí)的優(yōu)勢:彈性,集群化管理,高性能,和專業(yè)服務(wù)等等。
?
舜天平臺揭秘
第四個(gè)登場的是阿里云資深技術(shù)專家張振祥,帶來了對阿里云FaaS舜天平臺的詳細(xì)剖析。議題指出阿里云FaaS舜天平臺是云上輸出FPGA高性價(jià)比算力的使能器,大幅降低了FPGA的應(yīng)用門檻。圍繞著“易用性、穩(wěn)定性、可擴(kuò)展性和安全性”的設(shè)計(jì)理念,舜天平臺做了大量的軟硬件創(chuàng)新。
?
張振祥強(qiáng)調(diào),以舜天平臺為依托,阿里云愿與業(yè)界的合作伙伴和客戶并肩攜手,打造FPGA異構(gòu)計(jì)算的健康而強(qiáng)大的生態(tài)圈。隨著云計(jì)算和人工智能的進(jìn)一步普及,FPGA的器件和技術(shù)將獲得進(jìn)一步的提升和改善,更好地適用大算力的應(yīng)用場景,服務(wù)更多的垂直市場。演講過程中,現(xiàn)場反應(yīng)熱烈,業(yè)界同仁對共建生態(tài)圈體感強(qiáng)烈。
舜天平臺助力阿里高性能時(shí)序數(shù)據(jù)庫
最后,阿里巴巴技術(shù)專家錢赟介紹了基于阿里云舜天平臺的高性能時(shí)序數(shù)據(jù)庫。從實(shí)際案例出發(fā),再次驗(yàn)證了舜天平臺的性能極致,資源易用,IP安全,同時(shí)又可以大幅降低計(jì)算成本等特性。
?
阿里云在異構(gòu)計(jì)算上的逐步深入和成熟,正在幫助越來越多的企業(yè)在云上實(shí)現(xiàn)創(chuàng)新和突破。比如剛剛在MS COCO大賽獲得4項(xiàng)世界冠軍的曠視科技就是阿里云異構(gòu)計(jì)算的深度用戶。客戶的成功一直是阿里云的訴求和共同目標(biāo),一起來用異構(gòu)計(jì)算開啟大計(jì)算時(shí)代吧。
原文鏈接
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的异构计算:软硬件结合全栈助力AI大爆发的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【深圳云栖大会】阿里云弹性计算ESSD云
- 下一篇: 玩转短视频?守护视频安全?AI智能提速?