TPU3.0今日上岗!谷歌AI芯片甩竞争对手好几条街!
今年5月份,谷歌CEO Sundar Pichai(劈柴哥)在谷歌IO大會上發(fā)布了TPU3.0芯片,聲稱其性能是上一代產(chǎn)品TPU2.0的8倍,達到了100Petaflops(Petaflops,每秒千萬億次浮點運算)。
在2016年的時候谷歌就發(fā)布了第一代TPU(Tensor Processing Unit),它是專門為機器學習定制的專用芯片(ASIC),一款谷歌自己高度定制化的AI芯片,也是為谷歌深度學習框架TensorFlow而設(shè)計的。傍著AlphaGo,TPU作為支撐起強大運算能力的芯片而聞名。今天,谷歌又宣布TPU3.0正式上崗了,進入Alpha內(nèi)測階段。
谷歌的TPU有多厲害?
這款芯片也是AlphaGo背后的功臣,即AlphaGo能以超人的熟練度下圍棋都要靠訓練神經(jīng)網(wǎng)絡(luò)來完成,而這又需要計算能力(硬件越強大,得到的結(jié)果越快),TPU就充當了這個角色,更重要的是借此顯現(xiàn)出了在AI芯片領(lǐng)域相對于英特爾CPU和英偉達GPU的優(yōu)勢。也就是說,采用TPU之后的AlphaGo的運算速度和反應(yīng)更快。
5年前,谷歌內(nèi)部就開始使用消耗大量計算資源的深度學習模型,這對CPU、GPU組合而言是一個巨大的挑戰(zhàn),谷歌深知如果基于現(xiàn)有硬件,他們將不得不將數(shù)據(jù)中心數(shù)量翻一番來支持這些復雜的計算任務(wù)。
谷歌的專用機器學習芯片TPU處理速度要比GPU和CPU快15-30倍(和TPU對比的是英特爾Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。
TPU對比Haswell處理器
在和英特爾“Haswell”Xeon E5 v3處理器來的對比中,我們可以看到,TPU各方面的表現(xiàn)都要強于前者。
在Google的測試中,使用64位浮點數(shù)學運算器的18核心運行在2.3 GHz的Haswell Xeon E5-2699 v3處理器能夠處理每秒1.3 TOPS的運算,并提供51GB/秒的內(nèi)存帶寬;Haswell芯片功耗為145瓦,其系統(tǒng)(擁有256 GB內(nèi)存)滿載時消耗455瓦特。
相比之下,TPU使用8位整數(shù)數(shù)學運算器,擁有256GB的主機內(nèi)存以及32GB的內(nèi)存,能夠?qū)崿F(xiàn)34GB/秒的內(nèi)存帶寬,處理速度高達92 TOPS ,這比Haswell提升了71倍,此外,TPU的熱功率只有384瓦。
谷歌在人工智能領(lǐng)域的各種動作
谷歌越來越關(guān)注神經(jīng)網(wǎng)絡(luò)和人工智能,以解決搜索、圖像處理和其他計算領(lǐng)域的問題。它也正在通過“AIY項目”這樣的計劃來促進開發(fā)人員和DIY社區(qū)對人工智能的興趣,這些計劃本身代表了人工智能。AIY Projects(AIY計劃),其目標是讓每個Maker(創(chuàng)客)都能DIY自己的 AI 人工智能產(chǎn)品,讓更多人能學習、探索并體驗人工智能。
比如今天上崗的TPU3.0,也傳遞著這樣的信號。
谷歌的這一做法印證了一個芯片產(chǎn)業(yè)的發(fā)展趨勢,即在AI負載和應(yīng)用所占數(shù)據(jù)中心比重越來越大的今天和未來,像谷歌、微軟、Facebook、亞馬遜、阿里巴巴、騰訊等這些數(shù)據(jù)中心芯片采購的大戶,其之前對于CPU和GPU的通用性需求可能會越來越少,而針對AI開發(fā)應(yīng)用的兼顧性能和能效的定制化芯片需求則會越來越多。
總結(jié)
以上是生活随笔為你收集整理的TPU3.0今日上岗!谷歌AI芯片甩竞争对手好几条街!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Kaggle上主要有两大方法:梯度提升机
- 下一篇: 清华“姚班”迎来00后,高校与企业共破A