日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

Imagination性能高达600TOPS的终极AI加速器:会给NVIDIA带来多少挑战者?

發(fā)布時(shí)間:2023/11/24 综合教程 45 生活家
生活随笔 收集整理的這篇文章主要介紹了 Imagination性能高达600TOPS的终极AI加速器:会给NVIDIA带来多少挑战者? 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

曾經(jīng)統(tǒng)治手機(jī)GPU IP市場的Imagination,歷經(jīng)變動(dòng)之后,目前在移動(dòng)GPU IP市場占有率有36%,汽車GPU IP市占率43%。近來,Imagination近期發(fā)布的一系列新品不僅是其實(shí)力的展現(xiàn),也足以讓同行們增加對這位老對手的關(guān)注。

11月13日,Imagination發(fā)布了耗時(shí)兩年研發(fā)的最新的第三代神經(jīng)網(wǎng)絡(luò)加速器(NNA)產(chǎn)品IMG Series4,其全新的多核架構(gòu)可提供600 TOPS(每秒萬億次操作)甚至更高的超高性能,主要面向先進(jìn)駕駛輔助系統(tǒng)(ADAS)和自動(dòng)駕駛應(yīng)用。

以低功耗產(chǎn)品見長Imagination推出高性能的終極AI加速器,會(huì)給在自動(dòng)駕駛汽車芯片市場占有領(lǐng)導(dǎo)地位的NVIDIA多大的沖擊?

Imagination在AI火熱的2017年推出首代神經(jīng)網(wǎng)絡(luò)加速器(NNA)PowerVR 2NX,單核性能從1TOPS到4.1TOPS。緊接著,2018年P(guān)owerVR 3NX發(fā)布,單核性能從0.6TOPS到10TOPS,多核產(chǎn)品性能從20TOPS到160TOPS。

性能增強(qiáng)的同時(shí),Imagination的NNA主要面向的市場也從2NX時(shí)的移動(dòng)設(shè)備和汽車市場,進(jìn)一步拓展到智能相機(jī)監(jiān)控、消費(fèi)電子(尤其是數(shù)字電視)、低功耗IoT智能設(shè)備領(lǐng)域。

時(shí)隔兩年之后,Imagination才推出第三代NNA產(chǎn)品4NX。4NX系列的單核性能進(jìn)一步提升,每個(gè)單核能以不到1瓦的功耗提供12.5TOPS的性能。相比前兩代NNA,新一代產(chǎn)品強(qiáng)調(diào)的是全新多核架構(gòu),這個(gè)新的多核架構(gòu)支持在多個(gè)內(nèi)核之間對工作負(fù)載進(jìn)行靈活的分配和同步,從而實(shí)現(xiàn)更高性能。

Imagination Technologies產(chǎn)品管理部門總監(jiān)Gilberto Rodriguez介紹:“我們的軟件提供了精細(xì)的控制能力,并通過對多個(gè)工作負(fù)載進(jìn)行批處理、拆分和調(diào)度而提高了靈活性,可以在任意數(shù)量的內(nèi)核上使用。Series4可為每個(gè)集群配置 2個(gè)、4個(gè)、6個(gè)或者8個(gè)內(nèi)核。1個(gè)8內(nèi)核的集群可以提供100TOPS的算力,配有6個(gè)8核集群的解決方案就可以提供600 TOPS的算力。”

至于為什么要推出如此高性能的AI加速器,Gilberto Rodriguez表示,“ADAS和自動(dòng)駕駛對芯片有很高的算力需求,比如L2+的駕駛員檢測或語音/手勢控制需要10TOPS的性能,L3-L4級別的自動(dòng)駕駛有50-100TOPS的性能需求,L5級別的自動(dòng)駕駛性能需求超過500TOPS。”

“雖然市場上已經(jīng)有滿足自動(dòng)駕駛需求的AI芯片,但功耗不夠理想。所以,我們花兩年時(shí)間去了解和評估客戶需求,基于我們的前兩代低功耗的產(chǎn)品,推出了高性能低功耗的4NX系列產(chǎn)品,并且將自動(dòng)駕駛作為主打市場,也可以應(yīng)用于數(shù)據(jù)中心和桌面級GPU。” Imagination Technologies視覺和人工智能部門高級總監(jiān)Andrew Grant表示。

需要指出的是,4NX系列的8內(nèi)核集群要實(shí)現(xiàn)100TOPS的性能,超過30 TOPS/Watt 的性能功耗比,以及超過12 TOPS/mm^2 的性能密度是要在5nm節(jié)點(diǎn)實(shí)現(xiàn)。

Gilberto Rodriguez也提到,如果要用多個(gè)集群實(shí)現(xiàn)更高算力,Imagination可以提供多集群的協(xié)同機(jī)制,但也需要客戶在應(yīng)用層進(jìn)行一些設(shè)計(jì)。

多核靈活架構(gòu)帶來的可擴(kuò)展性讓4NX可以實(shí)現(xiàn)高性能,但對于高性能芯片而言,功耗的控制也非常關(guān)鍵,特別是AI芯片。AI芯片需要處理大量的數(shù)據(jù),并且數(shù)據(jù)的搬運(yùn)耗費(fèi)的功耗遠(yuǎn)大于數(shù)據(jù)處理,因此,高性能AI芯片必須想辦法盡量減少數(shù)據(jù)的搬運(yùn),同時(shí)降低延遲和節(jié)省帶寬。

對于延遲的降低,Imagination采用的方法是單核組成2核、4核、6核或8核的多核集群中,所有內(nèi)核可以相互協(xié)作,并行處理一個(gè)任務(wù),降低處理延遲,縮短響應(yīng)時(shí)間。當(dāng)然,集群中和多核既可以共同執(zhí)行一個(gè)批處理任務(wù),也可以分別運(yùn)行各自不同的網(wǎng)絡(luò),也就是各個(gè)內(nèi)核能夠獨(dú)立運(yùn)行。


核數(shù)的增加帶來性能提升的同時(shí)降低延遲


不同的核獨(dú)立運(yùn)行

具體而言,神經(jīng)網(wǎng)絡(luò)的多層以融合內(nèi)核的形式運(yùn)行在加速器的硬件流水線里,融合內(nèi)核之間的特征圖(Feature Map)需要通過外部存儲(chǔ)進(jìn)行交換。Tiling技術(shù)是充分利用緊耦合的 SRAM 來融合更多的層,更多的層被融合之后,就減少了需要通過外部存儲(chǔ)交換的特征圖,進(jìn)而達(dá)到提升效率,節(jié)省帶寬的目的。

還需要說明一下Tensor Tiling技術(shù)中的批處理和拆分,批處理是分配適合批處理的大量的小型網(wǎng)絡(luò)任務(wù)到每個(gè)獨(dú)立工作的NNA單核,能夠提升并行處理能力。拆分則是任務(wù)在多個(gè)維度被拆分,所有NNA單核共同執(zhí)行一個(gè)推理任務(wù),減少網(wǎng)絡(luò)推理延遲的同時(shí),在理想情況下協(xié)同并行處理的吞吐量與獨(dú)立并發(fā)處理的相同,非常適合網(wǎng)絡(luò)層很大的網(wǎng)絡(luò)。

當(dāng)然,Tensor Tiling的拆分是通過Imagination提供的編譯器來完成,不需要開發(fā)者手動(dòng)完成,并且利用NNA的性能分析工具能夠?qū)I任務(wù)進(jìn)行更好地調(diào)度和分配。

那Tensor Tiling在節(jié)省帶寬的同時(shí)能否減少數(shù)據(jù)的搬移?Gilberto Rodriguez表示,“答案是肯定的。一方面,Tensor Tiling讓待處理數(shù)據(jù)通過內(nèi)存帶寬的傳輸減少,另一方面,重復(fù)利用的神經(jīng)網(wǎng)絡(luò)權(quán)重給處理器核的傳輸次數(shù)也減少,這讓就可以有效減少數(shù)據(jù)搬運(yùn)。”

硬件上層的工具鏈方面,Imagination的離線和在線工具組成的工作流程可以讓開發(fā)者更快實(shí)現(xiàn)部署。

NVIDIA在2015年就推出了車載計(jì)算平臺(tái),此后持續(xù)迭代,目前在自動(dòng)駕駛芯片市場已經(jīng)處于優(yōu)勢地位。不過,擅長桌面級GPU的NVIDIA能夠提供高性能,但功耗可能對于電池供電的電動(dòng)汽車不夠友好。這也是在對功耗要求比較嚴(yán)格的移動(dòng)端有優(yōu)勢的Imagination的機(jī)會(huì)所在。

與NVIDIA有所不同,Imagination是IP提供商,并不會(huì)直接提供芯片。因此,Imagination可以與領(lǐng)先的汽車行業(yè)顛覆者、一級供應(yīng)商、整車廠(OEM)和汽車系統(tǒng)級芯片(SoC)廠商合作,推出有競爭力的產(chǎn)品。為了幫助合作伙伴更好進(jìn)入這一市場更快推出車規(guī)級產(chǎn)品,此次推出的NX4還包含IP級別的安全功能且設(shè)計(jì)流程符合ISO 26262標(biāo)準(zhǔn)。ISO 26262是旨在解決汽車電子產(chǎn)品風(fēng)險(xiǎn)的行業(yè)安全標(biāo)準(zhǔn)。

新推出的4系列NNA可以在不影響性能的情況下,安全地進(jìn)行神經(jīng)網(wǎng)絡(luò)推理。硬件安全機(jī)制可以保護(hù)編譯后的網(wǎng)絡(luò)、網(wǎng)絡(luò)的執(zhí)行和數(shù)據(jù)處理管道。

這就意味著,自動(dòng)駕駛芯片市場將會(huì)迎來更多有競爭力的產(chǎn)品。雷鋒網(wǎng)認(rèn)為,Imagination更強(qiáng)的GPU和NNA產(chǎn)品組合將會(huì)幫助更多想要進(jìn)入這一市場的公司推出更有競爭力的產(chǎn)品。上個(gè)月,Imagination發(fā)布了最新一代的IMG B系列高性能GPU IP,這款多核架構(gòu)GPU IP 4個(gè)系列內(nèi)核有33種配置。

ABI Research預(yù)計(jì),到2027年左右,對ADAS的需求將增長兩倍,但汽車行業(yè)已然將目光投向了更遠(yuǎn)的全自動(dòng)駕駛汽車和自動(dòng)駕駛出租車,從L2和L3級ADAS向L4和L5級全自動(dòng)駕駛演進(jìn)的過程中,高性能、低延遲和高能效的結(jié)合將是關(guān)鍵所在。

巨大的市場機(jī)會(huì)之下,兩家芯片產(chǎn)品優(yōu)勢類似的公司,會(huì)如何競爭?

總結(jié)

以上是生活随笔為你收集整理的Imagination性能高达600TOPS的终极AI加速器:会给NVIDIA带来多少挑战者?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 在线毛片网站 | 久久精品97 | 亚洲春色www | 五月婷婷色丁香 | 日本乱淫视频 | 亚洲天堂精品在线观看 | 动漫美女露胸网站 | 精品国产人妻一区二区三区 | 欧美激情第1页 | 蜜臀久久99精品久久久久宅男 | 国产黑丝在线 | 久久久精品免费视频 | 九九精品视频在线观看 | 欧美性www| 免费av电影网址 | 97av超碰| 在线观看网站污 | 国产精品视频区 | 日韩成人性视频 | 欧美激情片一区二区 | 91视频最新| 伊人最新网址 | 国产swag在线观看 | 亚洲我射av| 97精品超碰一区二区三区 | 国产成人精品一区二区三区免费 | 精品三级在线 | 在线中文字幕播放 | 女女调教被c哭捆绑喷水百合 | 欧美天天性影院 | 天堂中文在线资源 | 国产天天综合 | 性色视频在线 | 国产又黄又粗的视频 | 噜噜色av| 操日本老妇 | 九色在线观看 | 国产精品视频麻豆 | 日本草逼视频 | 亚洲视频入口 | 网站在线播放 | 亚洲一区在线观看视频 | 亚洲欧洲国产综合 | 91福利免费 | 2018天天操 | 欧美日韩在线精品 | 久久久久逼 | av看片| 精品一区二区三区免费毛片爱 | 一本色道久久综合 | 奇米av在线 | 火影黄动漫免费网站 | 一边摸一边抽搐一进一出视频 | 国产盗摄一区二区三区 | 美女黄污网站 | 乌克兰毛片 | 久久久97| 性久久久久久久 | 国产在线美女 | 亚洲精品综合在线观看 | 黄在线视频 | 欧美一级高清片 | 中文乱码人妻一区二区三区视频 | 国产午夜不卡 | 黑人极品videos精品欧美裸 | 久久福利网站 | 中文字幕一区二区在线观看视频 | av无限看 | zzjj国产精品一区二区 | 久久国产精品免费视频 | 国产白丝袜美女久久久久 | 超碰天天操 | 成人免费一区二区 | 亚洲第一欧美 | 欧美a在线观看 | 欧美精品黑人 | 国产精品乱码一区 | 成年人一级片 | www.亚洲综合 | 成人看片在线观看 | 亚洲最大av | 激情视频网址 | 久久国产欧美日韩精品 | 亚洲精华国产精华精华液网站 | 亚洲AV无码AV吞精久久中文版 | 成人在线你懂的 | 日本视频网 | 国产淫视 | 亚洲一区二区三区视频 | 成人欧美在线视频 | 娇小的粉嫩xxx极品 国产精品人人爽人人爽 | 日本免费三级网站 | 国产你懂 | 国产视频网站在线观看 | 国产精品情侣呻吟对白视频 | 久久精品爱| 欧美性猛交xxxx乱大交俱乐部 | www.超碰在线| 欧美日韩国产成人精品 |