日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

NVIDIA发布三款新品,各自侧重点有何不同? | GTC China 2016

發布時間:2025/3/15 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NVIDIA发布三款新品,各自侧重点有何不同? | GTC China 2016 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

黃鑫,宗仁聯合編輯。

NVIDIA今天在GTC China2016上發布了新的產品:專為深度學習設計的推理加速器Tesla P4和Tesla P40,以及專為自動駕駛和汽車人工智能開發的低功耗計算機Drive PX2 for autocruise。

NVIDIA的傳統強項是桌面和移動PC GPU,不過堅定的向著AI大踏步邁進的它顯然已經不滿足于一味的在單一領域做提高GPU性能的事了。我們曾經提到過,AI的研發和應用分為好幾個階段,NVIDIA傳統的計算密集型GPU產品只會對訓練算法這一項起到顯著的改善作用,但NVIDIA顯然是不會甘心只拿下這一領域的,而是希望將整個開發流程都包括進去。P4和P40同之前放置于超級計算機DGX-1內的P100定位類似,但功能側重點有所不同。P100專注于加速神經網絡的訓練速度。而P4和P40專注于提高CPU的推理,也就是邏輯運算效率。一下是3款新品的側重點盤點:

P4 VS P40 ?VS?Drive PX2 Autocruise

一. P4專注于提高CPU的推理,也就是邏輯運算效率。

* 單精度浮點為5.5 TeraFLOPS

*?INT8指標為22 TOPS

*?內置8GB GDDR5顯存

*?2560 CUDA核心

*?支持192 GBPs帶寬。

*?集成72 億個晶體管

*?NVIDIA稱P4性能是去年發布的M4的四倍

*?主要負責圖像、文字和語音識別

二. P40專注于提高CPU的推理,也就是邏輯運算效率。可將CPU推理加速40倍。

* 單精度浮點為12 TeraFLOPS

*?INT8指標(衡量深度學習)為47 TOPS

* 內置24GB GDDR5顯存

*?3840 CUDA核心

*?346 GBps帶寬

* 集成120 億個晶體管

*?NVIDIA稱P40性能是去年發布的M40的四倍

*?主要負責圖像、文字和語音識別



三. ?PX 2 AUTOCRUISE計算平臺適用于自動巡航功能(包括高速公路自動駕駛和高清制圖)

*?能夠實時了解周邊情況

*?在高精度地圖上精確定位,以及規劃安全行車路線。該平臺采用了新型單處理器配置

*?幫助車輛利用深度神經網絡處理來自多個攝像頭和傳感器的數據。

*?功率僅為10W


著重提一下Drive PX2 Autocruise

不過,這些都還算是NVIDIA的傳統強項。其各項數據指標除了比前代產品m4/m40更快更高更強一點也沒有太多值得說的地方。令人感興趣的反而是這塊看起來弱弱的Drive PX2 Autocruise。

首先一個非常亮眼的數據是它的功耗只有10w,這或許是因為它使用的是NVIDIA為移動平臺開發的Tegra系列處理器,不過不管怎樣這個功耗可以說是十分亮眼的,因為同等級的FPGA產品的功耗水平也基本就是在這個程度,甚至還會更高一些。并且它的功能定位聚焦于高速公路上的自動巡航,而并不是整個自動駕駛領域。這也很好理解,單移動處理器的架構和極低的功耗必然無法支撐起超大規模的計算。不過NVIDIA的意思也不在于此。

NVIDIA表示,這款產品可以同NVIDIA的DGX-1相配合。在NVIDIA描述出的圖景中,數據科學家可以在數據中心利用NVDIA DGX-1訓練深度神經網絡,然后把訓練好的神經網絡在車輛配備的NVIDIA DRIVE PX2上運行。NVIDIA為DGX-1和Drive PX2 for autocruise開發了完全相同的NVIDIA DRIVEWorks算法、庫、工具。讓研究者可以方便的進行通用開發。

也就是說,這臺計算機(Drive PX2 for autocruise)一開始就不是設計用來開發的,而是一臺應用層面的設備。也就是說,NVIDIA用產品囊括完整AI開發流程的行動又開始了一個新的階段。

小結

今天會上,黃仁勛著重表示——P4專為加速1U OCP服務器而設計,功率僅為50W;P40專為最大吞吐量而設計,能將CPU推理加速40倍。連同在今年美國GTC上將發布的超大規模數據中心加速器Tesla p100與P4/P40將在深度學習的訓練和推理兩端,為數據中心帶來端到端的深度學習平臺

至此,NVIDIA在人工智能領域已經形成了以Tesla P100和DGX-1為核心的訓練系統;以P4/P40和Tensor-RT為核心的數據中心推理系統;以及以DRIVE PX 2與Driveworks為核心的智能駕駛體系。通過全面布局構建了端到端的深度學習平臺。

在這場發布會上,Drive PX2 autocruise的戰略地位可能甚至會高于P4和P40。雖然它是一塊自動駕駛芯片,不過NVIDIA的真正意圖應該還是跳出作為傳統強項的AI研發領域,通過這款產品為自己在AI應用層面的進一步發展做準備和試驗。NVIDIA明顯已經鐵了心要成為AI的領導者之一,要達到這個目的,類似Drive PX2 for autocruise這樣的針對特定場景設計的計算機是必不可少的。這款產品也可以看作是NVIDIA的一個試水之作,如果其獲得了足夠的成功,我們可能很快就能在其他一些物聯網產品上也看到NVIDIA的身影了。


本文作者:黃鑫


本文轉自雷鋒網禁止二次轉載,原文鏈接

總結

以上是生活随笔為你收集整理的NVIDIA发布三款新品,各自侧重点有何不同? | GTC China 2016的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。