AI芯片体系结构目标图形处理
AI芯片體系結(jié)構(gòu)目標(biāo)圖形處理
AI chip architecture targets graph processing
可編程圖形流處理器(GSP)能夠執(zhí)行“直接圖形處理、片上任務(wù)圖管理和執(zhí)行以及任務(wù)并行性”。設(shè)計(jì)GSP是為了滿足人工智能處理的需求,而這些需求以前是GPU、CPU或DSP無(wú)法滿足的。
GSP體系結(jié)構(gòu)由一系列圖形流處理器、專(zhuān)用數(shù)學(xué)處理器、硬件控制和各種類(lèi)型的數(shù)據(jù)緩存組成。GSP可以提供:“真正的任務(wù)級(jí)并行,最小限度地使用片外存儲(chǔ)器,深度優(yōu)先的硬件圖形調(diào)度,完全可編程的體系結(jié)構(gòu)?!?/p>
圖形計(jì)算
雖然人工智能有許多不同類(lèi)型的神經(jīng)網(wǎng)絡(luò),所有的神經(jīng)網(wǎng)絡(luò)都是基于圖形的,這允許開(kāi)發(fā)人員利用圖形原生結(jié)構(gòu)在單個(gè)架構(gòu)上構(gòu)建多個(gè)神經(jīng)網(wǎng)絡(luò)和整個(gè)工作流。
然而,在圖形計(jì)算領(lǐng)域,人工智能處理中需要“數(shù)據(jù)流圖的優(yōu)化和編譯”。
GSP聲稱(chēng)在三個(gè)方面與其他基于圖形的數(shù)據(jù)流處理器有所不同。
首先,“完全可編程的”,能夠執(zhí)行“廣泛的任務(wù)”。
其次,它是“動(dòng)態(tài)可編程的……在一個(gè)時(shí)鐘周期內(nèi)”
第三,“提供流媒體的集成”,這使得最小化延遲成為可能。這種巨大的效率倍增器是通過(guò)“數(shù)據(jù)流機(jī)制”實(shí)現(xiàn)的,在這種機(jī)制中,非計(jì)算性數(shù)據(jù)移動(dòng)被最小化或消除。
GSP體系結(jié)構(gòu)的圖形本機(jī)特性可以最小化數(shù)據(jù)在外部DRAM之間的來(lái)回移動(dòng)。外部只需要第一個(gè)輸入和最終輸出,而中間的其他數(shù)據(jù)只是臨時(shí)的中間數(shù)據(jù)。這將大大減少內(nèi)存帶寬和功耗。
在芯片、板和系統(tǒng)級(jí)別上盡可能降低延遲、減少內(nèi)存需求和能源需求。
試點(diǎn)項(xiàng)目的經(jīng)驗(yàn)教訓(xùn)
通過(guò)盡早推出GSP嵌入式桌面設(shè)備,“我們獲得了進(jìn)入真正客戶及其工作負(fù)載需求的入場(chǎng)券?!?br /> 通過(guò)這些試點(diǎn),基于GSP的平臺(tái)有更多的應(yīng)用程序和細(xì)分市場(chǎng)。其普惠制解決的市場(chǎng)范圍從汽車(chē)和智能視覺(jué)(監(jiān)視)到企業(yè)計(jì)算。
GSP可以滿足從云中的數(shù)據(jù)中心到收集數(shù)據(jù)的邊緣的所有地方施加的較低的能量限制。
GSP的驅(qū)動(dòng)力正在迅速改變深度學(xué)習(xí)技術(shù),包括新的拓?fù)洹⑸窠?jīng)網(wǎng)絡(luò)和算法。如此快節(jié)奏的技術(shù)進(jìn)步常常促使客戶希望芯片能做XYZ。這就是完全可編程的GSP架構(gòu)發(fā)揮作用的地方。
例如,在汽車(chē)領(lǐng)域,GSP將應(yīng)用于智能遠(yuǎn)程信息處理、ADAS、駕駛員監(jiān)控和乘客評(píng)估。關(guān)鍵是許多汽車(chē)應(yīng)用的單一GSP體系結(jié)構(gòu)。
例如,單芯片可以結(jié)合激光雷達(dá)傳感器輸入和點(diǎn)云進(jìn)行ISP處理、語(yǔ)義分割和傳感器融合。這是通過(guò)視頻目標(biāo)檢測(cè)和激光測(cè)距兩個(gè)并行執(zhí)行的數(shù)據(jù)流圖來(lái)實(shí)現(xiàn)的。
由于GSP的主要市場(chǎng)是汽車(chē)(汽車(chē)客戶總是要求確定性),GSP架構(gòu)是“確定性的”。
最終開(kāi)發(fā)了一個(gè)名為“Blaize NetDeploy”的工具。許多客戶已經(jīng)花了數(shù)周時(shí)間在優(yōu)化GPU上經(jīng)過(guò)訓(xùn)練的人工智能模型,并將其轉(zhuǎn)換為在推理機(jī)上部署。一個(gè)軟件工具,可以加速量化、修剪和壓縮神經(jīng)網(wǎng)絡(luò)的過(guò)程。
總結(jié)
以上是生活随笔為你收集整理的AI芯片体系结构目标图形处理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 使用Keil语言的嵌入式C编程教程(下)
- 下一篇: 为放大器模拟输入模块提供可靠的输入过电压