日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

Yann LeCun:深度学习硬件前瞻

發(fā)布時間:2025/3/21 pytorch 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Yann LeCun:深度学习硬件前瞻 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Yann LeCun被大家譽為“卷積神經(jīng)網(wǎng)絡(luò)之父”,該技術(shù)助推了人工智能在Google、Facebook等公司的發(fā)展,在此之外,LeCun也已經(jīng)不再局限于扎根算法領(lǐng)域。正如那些開發(fā)全新計算方法的人一樣,他在硬件領(lǐng)域也有深厚背景,尤其是芯片設(shè)計,并且在硬件專業(yè)化,復(fù)雜問題下的數(shù)據(jù)遷移,以及核性能提升方面也很拿手。

LeCun是從貝爾實驗室的研究真正開始開拓深度學(xué)習(xí)的,他的研究項目結(jié)合了先進的軟硬件聯(lián)合設(shè)計技術(shù)(co-design)。即使在今天,他在服務(wù)器端的機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)循環(huán)仍廣為人知。他本周在Hot Chips會議上做了這方面介紹。在關(guān)于神經(jīng)網(wǎng)絡(luò)進化(硬件和軟件)的演講中,LeCun除了介紹自己在貝爾實驗室、Facebook研究院和紐約大學(xué)(眾多研究機構(gòu)之一)的經(jīng)歷之外,還擠出時間和The Platform交流了關(guān)于卷積神經(jīng)網(wǎng)絡(luò)在聯(lián)合設(shè)計方面今后的發(fā)展。

最后,他基于現(xiàn)階段深度學(xué)習(xí)的能力,以及下一階段更智能、更大規(guī)模的神經(jīng)網(wǎng)絡(luò),描繪了未來架構(gòu)的前景。LeCun觀點的引人關(guān)注之處并不令人驚訝:當(dāng)前架構(gòu)在性能上不足以承受下一代機器學(xué)習(xí)算法,因為新的算法已經(jīng)超越了現(xiàn)有加速工具和程序性能的局限之處。

正如五月份的采訪所描述,我們和LeCun談到的GPU計算在深度學(xué)習(xí)中的地位,我們了解到GPU加速方法不僅在訓(xùn)練大規(guī)模神經(jīng)網(wǎng)絡(luò)時有用,還亟需被改進來處理另一部分問題,也就是運行真正的post-training算法。本周,LeCun再次提及此,他解釋說大多數(shù)模型訓(xùn)練在4個或8個GPU的服務(wù)器端上完成,Google和Facebook正嘗試在多個節(jié)點上用這套裝置并行化運行訓(xùn)練算法。他還提到說盡管普遍猜測Google擁有GPU的數(shù)量在8000個左右,但事實上遠(yuǎn)遠(yuǎn)不止,而且隨著圖片、視頻數(shù)據(jù)集的不斷增長,GPU的規(guī)模還在擴大。

但也許更有趣的想法是把FPGA作為可配置器件用于神經(jīng)網(wǎng)絡(luò)處理更大的網(wǎng)絡(luò)(同時GPU仍舊保持高性能訓(xùn)練機制)。LeCun向ThePlatform透露,傳言Google正在定制硬件設(shè)備來運算神經(jīng)網(wǎng)絡(luò),而這一硬件正是基于FPGA。在The Platform其它版塊也報道過,Microsoft正在嘗試使用FPGA加速神經(jīng)網(wǎng)絡(luò)計算,并一直在尋找擁有更強大計算能力的可編程邏輯器件。

如果Google正在做某件事,Microsoft也是齊頭并進,毫無疑問Facebook也一定在做,其它一些神經(jīng)網(wǎng)絡(luò)前沿開發(fā)的公司都跑不了。盡管我們很難理解Intel出資$167億美元收購Altera,但是這些消息的確釋放出了某些信號。LeCun說,像Google和Facebook這個規(guī)模的公司在使用有專利的硬件時會十分慎重。“實際上他們都是用自己的硬件設(shè)備或者是一些可編程的”,他說道,這使得FPGA的機會大門又敞開了一寸。

那么就下一代神經(jīng)網(wǎng)絡(luò)處理所使用的這種特殊硬件方法而言,又將會意味著什么呢?上述內(nèi)容可以用LeCun本周演講的一張幻燈片來概括,它展示了卷積神經(jīng)網(wǎng)絡(luò)在人臉識別的應(yīng)用究竟有多深。在LeCun的職業(yè)生涯早期,都是一些簡單對圖片分類(例如,區(qū)分飛機和汽車)的任務(wù),現(xiàn)如今已經(jīng)相當(dāng)復(fù)雜,Facebook作為(公開的)大規(guī)模使用神經(jīng)網(wǎng)絡(luò)做圖片識別的用戶,能夠在5秒之內(nèi)搜索8億個人并找到一張人臉。

這個問題的軟件一端已經(jīng)用其它方式解決了,采用了如Torch、Caffe等開源的計算框架。但回到訓(xùn)練神經(jīng)網(wǎng)絡(luò)和用于高效大規(guī)模運行的下一代硬件這個話題,如何來尋找一個平衡點,尤其是考慮到相對“基礎(chǔ)”的計算需求(大規(guī)模數(shù)據(jù)集的快速訓(xùn)練,以及高并行化的加/乘運算操作)。

這些問題早就擺在了LeCun面前。早在1980年代和1990年代初期,LeCun和他的同事在貝爾實驗室就探索了開發(fā)卷積神經(jīng)網(wǎng)絡(luò)定制硬件的早期道路。ANNA的芯片是這一領(lǐng)域的產(chǎn)品之一,盡管它從未被用于貝爾實驗室(其它地方)的商業(yè)化應(yīng)用,但確實顯示了專業(yè)化硬件,即簡單的邏輯乘法器,微調(diào)神經(jīng)網(wǎng)絡(luò)的能力比現(xiàn)有通用處理器強多了。事實上,當(dāng)時ANNA芯片有著備受矚目的性能,包括每秒處理40億次運算——在1991年是了不起的成就,對解決當(dāng)時新涌現(xiàn)的一類問題很有幫助。

如果你仔細(xì)了解ANNA芯片,會發(fā)現(xiàn)其最終目標(biāo)到現(xiàn)在仍未改變。比如,這款芯片對ANNA電路設(shè)計的益處在于它能夠限制和外部存儲的數(shù)據(jù)傳輸量,這也就意味著芯片的速度不再受限制于處理器能夠承受多少運算量——而是受牽制于芯片和外部進行通信的帶寬。那個設(shè)計概念在多核運算的世界經(jīng)過一番周折,但是它在復(fù)雜環(huán)境下性能不足。按照那個設(shè)計思路,當(dāng)然是這樣。畢竟,有一堆多余的額外能力有什么用?這里“可配置性”這個概念又被拋了出來。

LeCun透露已經(jīng)有用相當(dāng)一部分卷積神經(jīng)網(wǎng)絡(luò)在FPGA上運算。比如,他提到了2000年代早期的一項場景分析和標(biāo)簽實驗,當(dāng)時團隊用Virtex-6 FPGA以50毫秒每幀的速度取得了不錯的準(zhǔn)確率。盡管這是一套完美的框架,不需要對數(shù)據(jù)做后期處理,然而當(dāng)年網(wǎng)絡(luò)的內(nèi)在因素限制了整個系統(tǒng)的性能。(同樣的,關(guān)于Virtex FPGA的這個想法,下一步在NetFlow架構(gòu)上實現(xiàn)時也遇到了其它限制因素,因為種種問題最終沒有轉(zhuǎn)化為產(chǎn)品——這都是后話)。

幾乎在第一批Virtex-6投入使用的同時,GPU計算也進入大家視野,它被證明對LeCun的后續(xù)工作很有用。LeCun指出了這點,以及其它推動圖像識別技術(shù)前進的技術(shù),包括開放來自ImageNet數(shù)據(jù)集的分屬于1000個類別的120萬張訓(xùn)練圖片,這屬于革命性的新能力。訓(xùn)練和分類圖像的機會呈指數(shù)級增加,Nvidia GPU的性能也開創(chuàng)了一片全新領(lǐng)域,當(dāng)時它的處理能力已經(jīng)達(dá)到每秒萬億次運算。

如果搭建一套完美的深度神經(jīng)網(wǎng)絡(luò)硬件平臺的需求是超級快的加/乘運算能力,能夠在現(xiàn)實場景計算神經(jīng)網(wǎng)絡(luò)算法,人們有理由相信在“可編程”器件(大概是一塊FPGA)的基礎(chǔ)之上,強大的GPU能夠橫掃所有訓(xùn)練過程。在某種程度上,這種模式已經(jīng)存在了一段時間,NVIDIA公司新的深度學(xué)習(xí)使用案例和大公司的豐富例子都在使用GPU進行模型訓(xùn)練,盡管不如真正處理網(wǎng)絡(luò)本身那么多。

LeCun的一張幻燈片總結(jié)了深度學(xué)習(xí)的一些硬件選擇。GPU目前占據(jù)了大規(guī)模訓(xùn)練這一端,同時也有其它許多新興技術(shù)正在走向黃金時期,生態(tài)系統(tǒng)正在逐步完善。

原文鏈接:A Glimpse into the Future of Deep Learning Hardware

總結(jié)

以上是生活随笔為你收集整理的Yann LeCun:深度学习硬件前瞻的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。