如何用免费GPU学习AI算法?这篇算法资源大集锦别错过
1
AI Studio是什么
AI Studio 是百度提供的一個針對 AI 學(xué)習(xí)者的在線一體化開發(fā)實訓(xùn)平臺。平臺集合了 AI 教程,深度學(xué)習(xí)樣例工程,各領(lǐng)域的經(jīng)典數(shù)據(jù)集,云端的運算及存儲資源,以及比賽平臺和社區(qū)。你可以把 AI Studio 看成國產(chǎn)版的 Kaggle。和 Kaggle 類似,AI Studio 也提供了 GPU 支持,但百度 AI Studio 在 GPU 上有一個很明顯的優(yōu)勢。?
Kaggle 最近把 Tesla K80 的 GPU 升級到了 P100,確實比以前快不少,但 AI Studio 采用的是 Tesla V100 的 GPU,更勝一籌。下表對比了兩款 GPU 性能:
AI Studio 提供了基于 ipython 和 Jupyter Notebook 的在線方案, 幾乎是當(dāng)前所有機器學(xué)習(xí)/深度學(xué)習(xí)的主流方案。AI Studio 支持的深度學(xué)習(xí)框架是飛槳。比起偏向于研究的 TensorFlow,飛槳偏向于應(yīng)用。通常 TensorFlow 的幾行代碼,飛槳一行就解決了。個人感覺飛槳對于初學(xué)者來說還是很友好的。
2
如何獲得免費算力卡
我之前寫過一篇文章關(guān)于
目前在開發(fā)者 QQ 群里聽到的消息是至少持續(xù)一個月的贈送,不知道下個月還有沒,所以大家趕緊薅起來,好好利用這免費的高性能 GPU 資源來「煉丹」。?
獲取算力方法使用資格很簡單。點進https://aistudio.baidu.com/aistudio/questionnaire?activityid=525,按照內(nèi)容提示填寫好信息,審核后管理員會給你發(fā)放一批算力卡。有了這批算力卡你就可以開始在 GPU 你的項目,而且運行項目又送算力卡,就像雞生蛋蛋生雞一樣,算力取之不竭。
3
AI Studio精選項目大合集
點擊“閱讀原文”或打開以下鏈接查看所有項目:?
https://aistudio.baidu.com/aistudio/messagedetail/42?
零基礎(chǔ)新手如何利用好AI studio?
熟悉 Python 的讀者可以跳過這節(jié)。純新手可能還不知道怎么用 AI Studio。其實很簡單。下面提供了很多教程,都是 jupyter notebook 形式的。你點開鏈接,會看到一個 fork 按鈕,然后在彈出的框里,輸入項目名稱和項目名字。?
完成后,會彈出對話框問你是否現(xiàn)在運行。
點擊”運行項目”,就會為你打開一個運行環(huán)境。?
進去之后,點擊”運行”按鈕,彈出選擇環(huán)境。
然后選擇運行環(huán)境。沒算力卡?沒關(guān)系。點擊上面的點擊申請,按照提示一步步點進去,提交成功后一段時間就有免費的算力拿了。以下的所有鏈接都是一個個 Jupyter Notebook,想要修改代碼和運行的話,就按照上面說的步驟 fork 了然后運行。深度學(xué)習(xí)新手入門項目合集:
https://aistudio.baidu.com/aistudio/projectdetail/128773
即使你是 Python 新手也沒關(guān)系,AI Studio 社區(qū)提供了新手入門教程,不需要你在本地搭建環(huán)境,直接在 AI Studio 提供的環(huán)境跑例程,增刪改代碼,測試自己的想法。Python 新手項目:《Python 零基礎(chǔ)速成課》。學(xué)完了上面的新手 Python 課程,在開始深度學(xué)習(xí)前想實戰(zhàn)一下 Python 技巧?這里有個 Python 爬蟲項目,教你從豆瓣爬電影數(shù)據(jù),很適合用來鞏固 Python 技巧,而且項目還教你用數(shù)據(jù)幀(dataframe)格式來顯示爬來的數(shù)據(jù),為后續(xù)學(xué)習(xí)機器學(xué)習(xí)項目打好基礎(chǔ),請參照:《Python 入門-豆瓣電影爬取》。
做完上述的分類器是否找到了一點入門的感覺?做點實用的吧。買房是每個人的人生大事?機器學(xué)習(xí)是否能讓你預(yù)測房價未來走勢呢?下面這個示例項目將采用線性回歸模型,帶著你探索這個問題,可查看:《波士頓房價預(yù)測》。
通過以上問題,是否對機器學(xué)習(xí)更有感覺了? 是否覺得以上模型太簡單,無法跟上你快速進步的步伐?好嘞,現(xiàn)在開始學(xué)習(xí)深度學(xué)習(xí)模型。首先從計算機視覺入門。計算機視覺入門最基礎(chǔ)的一個數(shù)據(jù)集是 MNIST。MNIST 共包含了 70000 個手寫數(shù)字圖像,數(shù)字范圍從 0-9。我們現(xiàn)在就要開發(fā)一個模型,讓模型能分辨手寫的?0-9,詳情請查看《深度學(xué)習(xí)入門 CV-手寫數(shù)字識別》。
是否太容易就到達 90% 多的準(zhǔn)確率?沒事,這里有不一樣的 MNIST 數(shù)據(jù),叫 fashion-mnist,但這次不是手寫數(shù)字,而是十類時裝(T-Shirt、連衣裙、鞋子、外套等),你還能保持同樣高準(zhǔn)確率嗎?詳情請查看《Fashion-MNIST 數(shù)據(jù)集》。除了計算機視覺,NLP(自然語言處理)也是深度學(xué)習(xí)里很熱門的領(lǐng)域。想入門 NLP,何不先試試文本分類呢?詳情請查看《深度學(xué)習(xí)入門?NLP-文本分類》。如果你是一個新手,經(jīng)過上述項目的訓(xùn)練,你應(yīng)該算是稍微入門了。接下來就是要進階了。
1. 進階學(xué)習(xí)者如何利用好AI Studio學(xué)習(xí)深度學(xué)習(xí)算法
深度學(xué)習(xí)進階總是痛苦的,主要的原因是沒有足夠示例,有示例也不夠詳細,有詳細的示例但又不知道從哪個看起。為了讓讀者快速入門,我按照從容易到復(fù)雜的順序,總結(jié)了一些示例,根據(jù)示例所屬的領(lǐng)域,難易程度,我分了兩個主要部分:- 計算機視覺(CV)
- 自然語言處理(NLP)
計算機視覺(CV)
項目地址:https://aistudio.baidu.com/aistudio/projectdetail/128832
首先我們可以學(xué)習(xí)與實踐下圖像分類的算法。圖像分類是根據(jù)圖像的信息將不同類別圖像區(qū)分開來, 是計算機視覺中重要的基本問題。圖像分類按粒度粗細也分兩種,粗細度的是識別類型,比如這是貓還是狗;細粒度是給你一張照片,讓你用模型識別這是緬因貓,還是挪威森林貓。現(xiàn)在我們先做粗粒度的貓狗識別分類器。我們的任務(wù)是訓(xùn)練一個分類器,去分辨哪些是貓,哪些是狗。詳情請查看《卷積神經(jīng)網(wǎng)絡(luò)實踐-貓狗分類》。
如果你掌握了上面的貓狗分類器,那恭喜你,對深度學(xué)習(xí)圖像分類模型又有了更進一步的了解。接下來我們要做細粒度的東西,是什么呢?就是現(xiàn)在很火的人臉識別。下面介紹個簡單的人臉識別模型。這個模型還能識別出章子怡的照片呢!想知道怎么弄的嗎?點開鏈接探究吧。詳情請查看《卷積神經(jīng)網(wǎng)絡(luò)-人臉識別初探》。
你也許學(xué)習(xí)完上面兩個示例,會提出疑問,貓狗識別是判斷一張照片里面的是貓還是狗,但一張照片里如果有 10 只貓,5 只狗該怎么辦?模型真的知道那個物體是目標(biāo)嗎?有什么辦法讓模型知道目標(biāo)呢?那就要先使用目標(biāo)檢測,把貓貓狗狗的位置圈定出來,然后再逐一處理。順便一提,聽起來高大上的無人駕駛技術(shù),目標(biāo)檢測也是其核心技術(shù)之一哦。接下來介紹幾個目標(biāo)檢測的模型。主流的目標(biāo)檢測算法主要分為兩個類型:
1)two-stage 方法,其主要思路是先通過啟發(fā)式方法(selective search)或者 CNN 網(wǎng)絡(luò)產(chǎn)生一系列稀疏的候選框,再對這些候選框進行分類與回歸。two-stage 方法的優(yōu)勢是準(zhǔn)確度高;代表算法是 R-CNN 系列算法。想更深入研究是怎么回事?AI Studio 社區(qū)提供了詳盡的 Mask RCNN 教程:https://aistudio.baidu.com/aistudio/projectdetail/122273
除了 Mask RCNN,另一個齊名的是 Faster-RCNN:
https://aistudio.baidu.com/aistudio/projectdetail/122275
2)one-stage 方法,如 YOLO 和 SSD,其主要思路是均勻地在圖片的不同位置進行密集抽樣,抽樣時可以采用不同尺度和長寬比,然后利用 CNN 提取特征后直接進行分類與回歸,整個過程只需要一步,所以其優(yōu)勢是速度快(所以在移動設(shè)備等低性能平臺上常用),但是均勻的密集采樣的一個重要缺點是訓(xùn)練比較困難,這主要是因為正樣本與負樣本(背景)極其不均衡,導(dǎo)致模型準(zhǔn)確度稍低。我在 AI Studio 社區(qū)找到了 YOLO 和 SSD 的教程。YOLO 教程使用的數(shù)據(jù)集是自定義的螺絲螺母數(shù)據(jù)集,以下教程涵蓋了 YOLO v3 和 YOLO v3-tiny,不僅讓你能學(xué)好 YOLO,而且還提供了可以部署在低能耗設(shè)備上的模型。接下來要介紹的是 SSD。下面這個教程使用的是基于預(yù)訓(xùn)練好的 mobile-net 訓(xùn)練的 SSD,使用的數(shù)據(jù)集是 pascal-voc。關(guān)于計算機視覺的進階內(nèi)容先介紹到這里,接下來介紹進階的 NLP 內(nèi)容。還想學(xué)更高階的 CV 模型算法請移步到下一章。自然語言處理?(NLP)
項目地址:https://aistudio.baidu.com/aistudio/projectdetail/128857我們又回到了 NLP 技術(shù)領(lǐng)域了。假設(shè)我們已經(jīng)學(xué)過前面爬豆瓣的那課, 我們獲取了某部著名電影的評論, 我們怎么知道它的口碑究竟如何呢? 通過這篇文章, 我們可以透過語言直接看到人類的情緒。不過為了方便起見,我們下面這個例子并不直接用之前采集的數(shù)據(jù)集,而是用的是已經(jīng)處理好的 IMDB 電影數(shù)據(jù)集。詳情請查看《循環(huán)神經(jīng)網(wǎng)絡(luò) NLP-情感分類》。其實情感分類是一個很重要的技術(shù),我之前做過對股票市場的情感分析算法,可以找出市場情感對股市走向的影響。不過如果你覺得情感分類還是太簡單的話,那恭喜你,你的進步是飛快的。那你接下來可以試試更難的,就是機器翻譯。飛槳框架收集了一個叫 WMT-14 的數(shù)據(jù)集,提供了 193319 條訓(xùn)練數(shù)據(jù)和 6003 條測試數(shù)據(jù),應(yīng)該夠你探索的了。詳情請查看《深度學(xué)習(xí)進階 NLP-機器翻譯》。2. 高階學(xué)習(xí)者如何利用好AI studio
和前面一樣,還是分計算機視覺和NLP(自然語言處理)兩個主要方向來介紹項目。計算機視覺(CV)
分類識別還不夠?來個人體姿態(tài)估計和追蹤的項目來轟炸一下你的大腦吧。下面這個項目是嘗試復(fù)現(xiàn)論文 Simple Baselines for Human Pose Estimation and Tracking?里的結(jié)構(gòu)。項目名:《人體姿態(tài)估計與追蹤之關(guān)鍵點檢測》。接下來介紹一個激動人心的技術(shù):GAN。生成對抗網(wǎng)絡(luò)(Generative Adversarial Network,簡稱 GAN)是一種非監(jiān)督學(xué)習(xí)的方式,通過讓兩個神經(jīng)網(wǎng)絡(luò)相互博弈的方法進行學(xué)習(xí)。
GAN 由一個生成網(wǎng)絡(luò)和一個判別網(wǎng)絡(luò)組成,生成網(wǎng)絡(luò)從潛在的空間(latent space)中隨機采樣作為輸入,其輸出結(jié)果需要盡量模仿訓(xùn)練集中的真實樣本。判別網(wǎng)絡(luò)的輸入為真實樣本或生成網(wǎng)絡(luò)的輸出,其目的是將生成網(wǎng)絡(luò)的輸出從真實樣本中盡可能的分辨出來。而生成網(wǎng)絡(luò)則盡可能地欺騙判別網(wǎng)絡(luò),兩個網(wǎng)絡(luò)相互對抗,不斷調(diào)整參數(shù)。生成對抗網(wǎng)絡(luò)常用于生成以假亂真的圖片。此外,該方法還被用于生成影片,三維物體模型等。我們將利用 GAN,做個圖像風(fēng)格遷移的項目:《風(fēng)格遷移之圖像翻譯?Pix2Pix》。
自然語言處理(NLP)
現(xiàn)在對話聊天機器人是很火的方向。但是要使得聊天機器人表現(xiàn)得懂用戶,那就需要識別對話情緒。專注于識別智能對話場景中用戶的情緒。在這方面百度發(fā)布了自己的模型 ERNIE。通過建模海量數(shù)據(jù)中的詞、實體及實體關(guān)系,學(xué)習(xí)真實世界的語義知識。相較于 BERT 學(xué)習(xí)原始語言信號,ERNIE 直接對先驗語義知識單元進行建模,增強了模型語義表示能力。下面這個項目將帶你學(xué)習(xí) ERNIE:《ERNIE 對話情緒識別》。之前我們講過語言情感分類和語言翻譯,你會覺得這不是很簡單嗎,對機器來說小兒科。但如果讓機器來做閱讀理解呢,或者讓機器去回答問題呢,有想過嗎?有個模型的提出讓以上這些問題都有了希望,這個模型就是 BERT(Bidirectional Encoder Representations from Transformers)。想知道 BERT 是什么,怎么工作的?下面這個項目能幫到你:《語義表示模型BERT》。機器閱讀理解(MRC)是自然語言處理(NLP)中的關(guān)鍵任務(wù)之一,需要機器對語言有深刻的理解才能找到正確的答案。機器閱讀理解領(lǐng)域有個著名的模型叫 BiDAF 模型 Bi-Directional Attention Flow for Machine Comprehension。下面這個項目將會幫助你了解更多:《機器閱讀理解之?BiDAF 模型》。3. 其他AI Studio上的學(xué)習(xí)項目
由于 CV 和 NLP 是熱門研究領(lǐng)域,以上項目都只提到 CV 和 NLP。但深度學(xué)習(xí)的研究范圍和應(yīng)用范圍很廣,只是限于篇幅原因不能一一詳盡。為了照顧到更多領(lǐng)域的讀者,以下還收集了一些推薦算法的 AI Studio 的項目,這里僅列舉一下,不再一一介紹。有興趣的讀者可以研究下。基于飛槳PaddlePaddle的SR-GNN推薦算法
https://aistudio.baidu.com/aistudio/projectdetail/124382
個性化推薦之多視角Simnet模型
https://aistudio.baidu.com/aistudio/projectdetail/122294
飛槳PaddlePaddle分布式推薦算法實踐
https://aistudio.baidu.com/aistudio/projectdetail/124378
用飛槳PaddlePaddle實現(xiàn)個性化推薦
https://aistudio.baidu.com/aistudio/projectdetail/127567
標(biāo)簽推薦算法之TagSpace
https://aistudio.baidu.com/aistudio/projectdetail/122298
推薦算法gru4rec之飛槳PaddlePaddle實現(xiàn)
https://aistudio.baidu.com/aistudio/projectdetail/122296
意猶未盡,還需要找更多的 AI Studio 深度學(xué)習(xí)項目?或者遇到問題不知道怎么解決?可以去下面兩個地方尋找?guī)椭?br />項目合集頁,在這里有很多官方和其他機器學(xué)習(xí)愛好者發(fā)布的項目:
https://aistudio.baidu.com/aistudio/projectoverview/public/1
論壇社區(qū),如果你出現(xiàn)難解的問題,不妨上來看看有沒人遇到過同樣的情況:
https://ai.baidu.com/forum/topic/list/192
4小結(jié)
本文介紹了一個免費贈送 GPU 算力的深度學(xué)習(xí)平臺 AI Studio。首先介紹了 AI Studio 是什么,在性能上有什么優(yōu)勢,同時也介紹了如何獲得免費 GPU 算力。最后用大量的篇幅介紹了如何利用好 AI Studio 上的學(xué)習(xí)資源,實現(xiàn)深度學(xué)習(xí)從入門到高階。?
現(xiàn)在每天贈送 24 小時算力,簡直是天上掉下的羊毛,不薅白不薅。羊毛不是天天有,該出手時就出手!?
點擊“閱讀原文”或打開以下鏈接查看所有項目:
https://aistudio.baidu.com/aistudio/messagedetail/42
?
現(xiàn)在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關(guān)注」訂閱我們的專欄吧
關(guān)于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學(xué)術(shù)平臺。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 訪問AI Studio
總結(jié)
以上是生活随笔為你收集整理的如何用免费GPU学习AI算法?这篇算法资源大集锦别错过的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 指导一下高二的青少年还可以长高5厘米吗?
- 下一篇: 6个月达不到25.6万年薪AI工程师,进