日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm

發(fā)布時間:2023/12/13 综合教程 39 生活家
生活随笔 收集整理的這篇文章主要介紹了 壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

GPU明星初創(chuàng)公司壁仞科技,選在公司創(chuàng)立即將三年之際正式發(fā)布首款通用GPU芯片BR100。

BR100采用7nm工藝,集成770億晶體管,使用Chiplet(芯粒)技術(shù),2.5D CoWos封裝技術(shù),芯片面積達(dá)到1000平方毫米。


壁仞科技創(chuàng)始人、董事長、CEO張文

壁仞科技2019年9月9日注冊成立,在成立后的短短18個月,融資額超過47億元,創(chuàng)下了國內(nèi)芯片創(chuàng)業(yè)公司融資的記錄,也成為了業(yè)界關(guān)注的焦點。

今天的發(fā)布會上,壁仞科技創(chuàng)始人、董事長、CEO張文也談到,大算力芯片創(chuàng)業(yè)至少要15億元起。而且,芯片行業(yè)本來就是資金密集、人才密集和資源密集的行業(yè)。

喊出響亮的口號顯然不能回應(yīng)業(yè)界的一些質(zhì)疑,只有真正強(qiáng)大的產(chǎn)品可以。

壁仞科技給出的數(shù)據(jù)顯示,其首款旗艦產(chǎn)品BR100對比英偉達(dá)在售的旗艦GPU峰值算力在Int8、BF16、TF32/TF32+、FP32數(shù)據(jù)格式下最少有3.3倍的峰值性能優(yōu)勢,在FP32數(shù)據(jù)格式下性能優(yōu)勢更是達(dá)到了13.1倍。

如果與國際廠商最新旗艦峰值算力對比,各種數(shù)據(jù)格式下也有性能優(yōu)勢。

對于一家初創(chuàng)公司來說,想要超越英偉達(dá)最新的H100 GPU,挑戰(zhàn)十分巨大,拋開其它因素,僅看一些關(guān)鍵參數(shù),就能看到兩者之間的差距,以及想要超越的難度。

英偉達(dá)今年發(fā)布的最新GPU H100,采用的是專為英偉達(dá)加速計算需求設(shè)計優(yōu)化的TSMC 4N 工藝,集成800億個晶體管,顯著提升了AI、HPC、顯存帶寬、互連和通信的速度,并能夠?qū)崿F(xiàn)近5TB/s的外部互聯(lián)帶寬。

英偉達(dá)CEO黃仁勛發(fā)布H100時表示,20個H100 GPU便可承托相當(dāng)于全球互聯(lián)網(wǎng)的流量,使其能夠幫助客戶推出先進(jìn)的推薦系統(tǒng)以及實時運行數(shù)據(jù)推理的大型語言模型。

當(dāng)然,壁仞科技聯(lián)合創(chuàng)始人、CTO洪洲也給出了壁仞科技首款通用GPU能實現(xiàn)突破性性能的底層原因——自主原創(chuàng)的芯片架構(gòu)壁立仞。

壁立仞架勢是以數(shù)據(jù)流為中心的架構(gòu),目標(biāo)就是打破當(dāng)前GPU架構(gòu)面臨的瓶頸,實現(xiàn)更強(qiáng)大的性能。具體而言,壁立仞架構(gòu)有6大特性:TF32+數(shù)據(jù)流精度、TDA數(shù)據(jù)流存取加速、C-Warp數(shù)據(jù)流并行、NME減少數(shù)據(jù)搬移、NUMA/UMA減少數(shù)據(jù)搬移、SVI數(shù)據(jù)流隔離。

洪洲說:“壁立仞架構(gòu)對數(shù)據(jù)流進(jìn)行深度的優(yōu)化,通過六大技術(shù)特性,比較完整地解決了數(shù)據(jù)搬移的瓶頸和并行度不足的問題,使得BR100芯片在給定的工藝下實現(xiàn)了性能和能效的跨越式進(jìn)步。”

除了架構(gòu)方面的努力,壁仞科技業(yè)采用了Chiplet的設(shè)計理念,讓芯片總面積可以突破光罩尺寸對單芯片面積的限制,集成更多的算力和通用性邏輯。“通過縮小單個計算芯粒的面積,還可以同時提升產(chǎn)能與良率,進(jìn)而極大地降低硅片的成本,并支持更靈活的產(chǎn)品策略。” 洪洲同時表示。

同樣采用壁立仞架構(gòu),擁有1個計算芯粒,性能約為BR100的一半,同樣超越了國際廠商的在售旗艦產(chǎn)品。


壁仞科技聯(lián)合創(chuàng)始人、CTO洪洲

基于BR100和BR104的產(chǎn)品分別叫做壁礪100和壁礪104,可以構(gòu)建從板卡模組到服務(wù)器的產(chǎn)品。

當(dāng)然,壁仞科技也深知大算力芯片比拼的是軟件和生態(tài),更需要客戶的支持。

基于BR100,壁仞科技自主研發(fā)BIRENSUPA軟件平臺,這一平臺位于軟件棧的中心位置,包括BIRENSUPA編程模型、加速庫、工具鏈、編譯器等組件。開發(fā)者可以通過這些組件,發(fā)揮BR100系列硬件的算力,并開發(fā)各種應(yīng)用。

發(fā)布會上,壁仞科技聯(lián)席CEO李新榮與百度飛槳訓(xùn)練芯片適配技術(shù)負(fù)責(zé)人李琦共同宣布,壁仞科技加入由百度飛槳發(fā)起的硬件生態(tài)共創(chuàng)計劃。

對于一家初創(chuàng)公司而言,建設(shè)生態(tài)的周期非常長,投入也十分巨大,所以壁仞科技也會兼容目前主流的GPU生態(tài),與客戶現(xiàn)有的基礎(chǔ)設(shè)施做到高度的兼容,方便客戶的遷移。

同時,壁仞也建設(shè)自己的生態(tài),比如,壁仞科技開發(fā)者云也已經(jīng)正式上線,官網(wǎng)上已開放邀測。

平安科技以及中國移動都在發(fā)布會上明確了與壁仞科技的合作目標(biāo)。

從硬件到軟件再到應(yīng)用,壁仞科技已經(jīng)正式交出了首款產(chǎn)品的答卷,接下來就要接受市場的檢驗了。

總結(jié)

以上是生活随笔為你收集整理的壁仞科技3年造出首款通用GPU:7nm工艺性能碾压NVIDIA 4nm的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。