當(dāng)前位置：首頁 > 人工智能 > pytorch >内容正文

pytorch

Yann LeCun：深度学习硬件前瞻

發(fā)布時間：2025/3/21 pytorch 35 豆豆

生活随笔收集整理的這篇文章主要介紹了 Yann LeCun：深度学习硬件前瞻小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Yann LeCun被大家譽為“卷積神經(jīng)網(wǎng)絡(luò)之父”，該技術(shù)助推了人工智能在Google、Facebook等公司的發(fā)展，在此之外，LeCun也已經(jīng)不再局限于扎根算法領(lǐng)域。正如那些開發(fā)全新計算方法的人一樣，他在硬件領(lǐng)域也有深厚背景，尤其是芯片設(shè)計，并且在硬件專業(yè)化，復(fù)雜問題下的數(shù)據(jù)遷移，以及核性能提升方面也很拿手。

LeCun是從貝爾實驗室的研究真正開始開拓深度學(xué)習(xí)的，他的研究項目結(jié)合了先進的軟硬件聯(lián)合設(shè)計技術(shù)（co-design）。即使在今天，他在服務(wù)器端的機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)循環(huán)仍廣為人知。他本周在Hot Chips會議上做了這方面介紹。在關(guān)于神經(jīng)網(wǎng)絡(luò)進化（硬件和軟件）的演講中，LeCun除了介紹自己在貝爾實驗室、Facebook研究院和紐約大學(xué)（眾多研究機構(gòu)之一）的經(jīng)歷之外，還擠出時間和The Platform交流了關(guān)于卷積神經(jīng)網(wǎng)絡(luò)在聯(lián)合設(shè)計方面今后的發(fā)展。

最后，他基于現(xiàn)階段深度學(xué)習(xí)的能力，以及下一階段更智能、更大規(guī)模的神經(jīng)網(wǎng)絡(luò)，描繪了未來架構(gòu)的前景。LeCun觀點的引人關(guān)注之處并不令人驚訝：當(dāng)前架構(gòu)在性能上不足以承受下一代機器學(xué)習(xí)算法，因為新的算法已經(jīng)超越了現(xiàn)有加速工具和程序性能的局限之處。

正如五月份的采訪所描述，我們和LeCun談到的GPU計算在深度學(xué)習(xí)中的地位，我們了解到GPU加速方法不僅在訓(xùn)練大規(guī)模神經(jīng)網(wǎng)絡(luò)時有用，還亟需被改進來處理另一部分問題，也就是運行真正的post-training算法。本周，LeCun再次提及此，他解釋說大多數(shù)模型訓(xùn)練在4個或8個GPU的服務(wù)器端上完成，Google和Facebook正嘗試在多個節(jié)點上用這套裝置并行化運行訓(xùn)練算法。他還提到說盡管普遍猜測Google擁有GPU的數(shù)量在8000個左右，但事實上遠(yuǎn)遠(yuǎn)不止，而且隨著圖片、視頻數(shù)據(jù)集的不斷增長，GPU的規(guī)模還在擴大。

但也許更有趣的想法是把FPGA作為可配置器件用于神經(jīng)網(wǎng)絡(luò)處理更大的網(wǎng)絡(luò)（同時GPU仍舊保持高性能訓(xùn)練機制）。LeCun向ThePlatform透露，傳言Google正在定制硬件設(shè)備來運算神經(jīng)網(wǎng)絡(luò)，而這一硬件正是基于FPGA。在The Platform其它版塊也報道過，Microsoft正在嘗試使用FPGA加速神經(jīng)網(wǎng)絡(luò)計算，并一直在尋找擁有更強大計算能力的可編程邏輯器件。

如果Google正在做某件事，Microsoft也是齊頭并進，毫無疑問Facebook也一定在做，其它一些神經(jīng)網(wǎng)絡(luò)前沿開發(fā)的公司都跑不了。盡管我們很難理解Intel出資$167億美元收購Altera，但是這些消息的確釋放出了某些信號。LeCun說，像Google和Facebook這個規(guī)模的公司在使用有專利的硬件時會十分慎重。“實際上他們都是用自己的硬件設(shè)備或者是一些可編程的”，他說道，這使得FPGA的機會大門又敞開了一寸。

那么就下一代神經(jīng)網(wǎng)絡(luò)處理所使用的這種特殊硬件方法而言，又將會意味著什么呢？上述內(nèi)容可以用LeCun本周演講的一張幻燈片來概括，它展示了卷積神經(jīng)網(wǎng)絡(luò)在人臉識別的應(yīng)用究竟有多深。在LeCun的職業(yè)生涯早期，都是一些簡單對圖片分類（例如，區(qū)分飛機和汽車）的任務(wù)，現(xiàn)如今已經(jīng)相當(dāng)復(fù)雜，Facebook作為（公開的）大規(guī)模使用神經(jīng)網(wǎng)絡(luò)做圖片識別的用戶，能夠在5秒之內(nèi)搜索8億個人并找到一張人臉。

這個問題的軟件一端已經(jīng)用其它方式解決了，采用了如Torch、Caffe等開源的計算框架。但回到訓(xùn)練神經(jīng)網(wǎng)絡(luò)和用于高效大規(guī)模運行的下一代硬件這個話題，如何來尋找一個平衡點，尤其是考慮到相對“基礎(chǔ)”的計算需求（大規(guī)模數(shù)據(jù)集的快速訓(xùn)練，以及高并行化的加/乘運算操作）。

這些問題早就擺在了LeCun面前。早在1980年代和1990年代初期，LeCun和他的同事在貝爾實驗室就探索了開發(fā)卷積神經(jīng)網(wǎng)絡(luò)定制硬件的早期道路。ANNA的芯片是這一領(lǐng)域的產(chǎn)品之一，盡管它從未被用于貝爾實驗室（其它地方）的商業(yè)化應(yīng)用，但確實顯示了專業(yè)化硬件，即簡單的邏輯乘法器，微調(diào)神經(jīng)網(wǎng)絡(luò)的能力比現(xiàn)有通用處理器強多了。事實上，當(dāng)時ANNA芯片有著備受矚目的性能，包括每秒處理40億次運算——在1991年是了不起的成就，對解決當(dāng)時新涌現(xiàn)的一類問題很有幫助。

如果你仔細(xì)了解ANNA芯片，會發(fā)現(xiàn)其最終目標(biāo)到現(xiàn)在仍未改變。比如，這款芯片對ANNA電路設(shè)計的益處在于它能夠限制和外部存儲的數(shù)據(jù)傳輸量，這也就意味著芯片的速度不再受限制于處理器能夠承受多少運算量——而是受牽制于芯片和外部進行通信的帶寬。那個設(shè)計概念在多核運算的世界經(jīng)過一番周折，但是它在復(fù)雜環(huán)境下性能不足。按照那個設(shè)計思路，當(dāng)然是這樣。畢竟，有一堆多余的額外能力有什么用？這里“可配置性”這個概念又被拋了出來。

LeCun透露已經(jīng)有用相當(dāng)一部分卷積神經(jīng)網(wǎng)絡(luò)在FPGA上運算。比如，他提到了2000年代早期的一項場景分析和標(biāo)簽實驗，當(dāng)時團隊用Virtex-6 FPGA以50毫秒每幀的速度取得了不錯的準(zhǔn)確率。盡管這是一套完美的框架，不需要對數(shù)據(jù)做后期處理，然而當(dāng)年網(wǎng)絡(luò)的內(nèi)在因素限制了整個系統(tǒng)的性能。（同樣的，關(guān)于Virtex FPGA的這個想法，下一步在NetFlow架構(gòu)上實現(xiàn)時也遇到了其它限制因素，因為種種問題最終沒有轉(zhuǎn)化為產(chǎn)品——這都是后話）。

幾乎在第一批Virtex-6投入使用的同時，GPU計算也進入大家視野，它被證明對LeCun的后續(xù)工作很有用。LeCun指出了這點，以及其它推動圖像識別技術(shù)前進的技術(shù)，包括開放來自ImageNet數(shù)據(jù)集的分屬于1000個類別的120萬張訓(xùn)練圖片，這屬于革命性的新能力。訓(xùn)練和分類圖像的機會呈指數(shù)級增加，Nvidia GPU的性能也開創(chuàng)了一片全新領(lǐng)域，當(dāng)時它的處理能力已經(jīng)達(dá)到每秒萬億次運算。

如果搭建一套完美的深度神經(jīng)網(wǎng)絡(luò)硬件平臺的需求是超級快的加/乘運算能力，能夠在現(xiàn)實場景計算神經(jīng)網(wǎng)絡(luò)算法，人們有理由相信在“可編程”器件（大概是一塊FPGA）的基礎(chǔ)之上，強大的GPU能夠橫掃所有訓(xùn)練過程。在某種程度上，這種模式已經(jīng)存在了一段時間，NVIDIA公司新的深度學(xué)習(xí)使用案例和大公司的豐富例子都在使用GPU進行模型訓(xùn)練，盡管不如真正處理網(wǎng)絡(luò)本身那么多。

LeCun的一張幻燈片總結(jié)了深度學(xué)習(xí)的一些硬件選擇。GPU目前占據(jù)了大規(guī)模訓(xùn)練這一端，同時也有其它許多新興技術(shù)正在走向黃金時期，生態(tài)系統(tǒng)正在逐步完善。

原文鏈接：A Glimpse into the Future of Deep Learning Hardware

總結(jié)

以上是生活随笔為你收集整理的Yann LeCun：深度学习硬件前瞻的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：随机森林入门攻略
下一篇：图像识别中的深度学习【香港中文大学王晓刚