如何用免费GPU学习AI算法?这篇算法资源大集锦别错过
1
AI Studio是什么
AI Studio 是百度提供的一個針對 AI 學習者的在線一體化開發實訓平臺。平臺集合了 AI 教程,深度學習樣例工程,各領域的經典數據集,云端的運算及存儲資源,以及比賽平臺和社區。你可以把 AI Studio 看成國產版的 Kaggle。和 Kaggle 類似,AI Studio 也提供了 GPU 支持,但百度 AI Studio 在 GPU 上有一個很明顯的優勢。?
Kaggle 最近把 Tesla K80 的 GPU 升級到了 P100,確實比以前快不少,但 AI Studio 采用的是 Tesla V100 的 GPU,更勝一籌。下表對比了兩款 GPU 性能:
AI Studio 提供了基于 ipython 和 Jupyter Notebook 的在線方案, 幾乎是當前所有機器學習/深度學習的主流方案。AI Studio 支持的深度學習框架是飛槳。比起偏向于研究的 TensorFlow,飛槳偏向于應用。通常 TensorFlow 的幾行代碼,飛槳一行就解決了。個人感覺飛槳對于初學者來說還是很友好的。
2
如何獲得免費算力卡
我之前寫過一篇文章關于
目前在開發者 QQ 群里聽到的消息是至少持續一個月的贈送,不知道下個月還有沒,所以大家趕緊薅起來,好好利用這免費的高性能 GPU 資源來「煉丹」。?
獲取算力方法使用資格很簡單。點進https://aistudio.baidu.com/aistudio/questionnaire?activityid=525,按照內容提示填寫好信息,審核后管理員會給你發放一批算力卡。有了這批算力卡你就可以開始在 GPU 你的項目,而且運行項目又送算力卡,就像雞生蛋蛋生雞一樣,算力取之不竭。
3
AI Studio精選項目大合集
點擊“閱讀原文”或打開以下鏈接查看所有項目:?
https://aistudio.baidu.com/aistudio/messagedetail/42?
零基礎新手如何利用好AI studio?
熟悉 Python 的讀者可以跳過這節。純新手可能還不知道怎么用 AI Studio。其實很簡單。下面提供了很多教程,都是 jupyter notebook 形式的。你點開鏈接,會看到一個 fork 按鈕,然后在彈出的框里,輸入項目名稱和項目名字。?
完成后,會彈出對話框問你是否現在運行。
點擊”運行項目”,就會為你打開一個運行環境。?
進去之后,點擊”運行”按鈕,彈出選擇環境。
然后選擇運行環境。沒算力卡?沒關系。點擊上面的點擊申請,按照提示一步步點進去,提交成功后一段時間就有免費的算力拿了。以下的所有鏈接都是一個個 Jupyter Notebook,想要修改代碼和運行的話,就按照上面說的步驟 fork 了然后運行。深度學習新手入門項目合集:
https://aistudio.baidu.com/aistudio/projectdetail/128773
即使你是 Python 新手也沒關系,AI Studio 社區提供了新手入門教程,不需要你在本地搭建環境,直接在 AI Studio 提供的環境跑例程,增刪改代碼,測試自己的想法。Python 新手項目:《Python 零基礎速成課》。學完了上面的新手 Python 課程,在開始深度學習前想實戰一下 Python 技巧?這里有個 Python 爬蟲項目,教你從豆瓣爬電影數據,很適合用來鞏固 Python 技巧,而且項目還教你用數據幀(dataframe)格式來顯示爬來的數據,為后續學習機器學習項目打好基礎,請參照:《Python 入門-豆瓣電影爬取》。
做完上述的分類器是否找到了一點入門的感覺?做點實用的吧。買房是每個人的人生大事?機器學習是否能讓你預測房價未來走勢呢?下面這個示例項目將采用線性回歸模型,帶著你探索這個問題,可查看:《波士頓房價預測》。
通過以上問題,是否對機器學習更有感覺了? 是否覺得以上模型太簡單,無法跟上你快速進步的步伐?好嘞,現在開始學習深度學習模型。首先從計算機視覺入門。計算機視覺入門最基礎的一個數據集是 MNIST。MNIST 共包含了 70000 個手寫數字圖像,數字范圍從 0-9。我們現在就要開發一個模型,讓模型能分辨手寫的?0-9,詳情請查看《深度學習入門 CV-手寫數字識別》。
是否太容易就到達 90% 多的準確率?沒事,這里有不一樣的 MNIST 數據,叫 fashion-mnist,但這次不是手寫數字,而是十類時裝(T-Shirt、連衣裙、鞋子、外套等),你還能保持同樣高準確率嗎?詳情請查看《Fashion-MNIST 數據集》。除了計算機視覺,NLP(自然語言處理)也是深度學習里很熱門的領域。想入門 NLP,何不先試試文本分類呢?詳情請查看《深度學習入門?NLP-文本分類》。如果你是一個新手,經過上述項目的訓練,你應該算是稍微入門了。接下來就是要進階了。
1. 進階學習者如何利用好AI Studio學習深度學習算法
深度學習進階總是痛苦的,主要的原因是沒有足夠示例,有示例也不夠詳細,有詳細的示例但又不知道從哪個看起。為了讓讀者快速入門,我按照從容易到復雜的順序,總結了一些示例,根據示例所屬的領域,難易程度,我分了兩個主要部分:- 計算機視覺(CV)
- 自然語言處理(NLP)
計算機視覺(CV)
項目地址:https://aistudio.baidu.com/aistudio/projectdetail/128832
首先我們可以學習與實踐下圖像分類的算法。圖像分類是根據圖像的信息將不同類別圖像區分開來, 是計算機視覺中重要的基本問題。圖像分類按粒度粗細也分兩種,粗細度的是識別類型,比如這是貓還是狗;細粒度是給你一張照片,讓你用模型識別這是緬因貓,還是挪威森林貓。現在我們先做粗粒度的貓狗識別分類器。我們的任務是訓練一個分類器,去分辨哪些是貓,哪些是狗。詳情請查看《卷積神經網絡實踐-貓狗分類》。
如果你掌握了上面的貓狗分類器,那恭喜你,對深度學習圖像分類模型又有了更進一步的了解。接下來我們要做細粒度的東西,是什么呢?就是現在很火的人臉識別。下面介紹個簡單的人臉識別模型。這個模型還能識別出章子怡的照片呢!想知道怎么弄的嗎?點開鏈接探究吧。詳情請查看《卷積神經網絡-人臉識別初探》。
你也許學習完上面兩個示例,會提出疑問,貓狗識別是判斷一張照片里面的是貓還是狗,但一張照片里如果有 10 只貓,5 只狗該怎么辦?模型真的知道那個物體是目標嗎?有什么辦法讓模型知道目標呢?那就要先使用目標檢測,把貓貓狗狗的位置圈定出來,然后再逐一處理。順便一提,聽起來高大上的無人駕駛技術,目標檢測也是其核心技術之一哦。接下來介紹幾個目標檢測的模型。主流的目標檢測算法主要分為兩個類型:
1)two-stage 方法,其主要思路是先通過啟發式方法(selective search)或者 CNN 網絡產生一系列稀疏的候選框,再對這些候選框進行分類與回歸。two-stage 方法的優勢是準確度高;代表算法是 R-CNN 系列算法。想更深入研究是怎么回事?AI Studio 社區提供了詳盡的 Mask RCNN 教程:https://aistudio.baidu.com/aistudio/projectdetail/122273
除了 Mask RCNN,另一個齊名的是 Faster-RCNN:
https://aistudio.baidu.com/aistudio/projectdetail/122275
2)one-stage 方法,如 YOLO 和 SSD,其主要思路是均勻地在圖片的不同位置進行密集抽樣,抽樣時可以采用不同尺度和長寬比,然后利用 CNN 提取特征后直接進行分類與回歸,整個過程只需要一步,所以其優勢是速度快(所以在移動設備等低性能平臺上常用),但是均勻的密集采樣的一個重要缺點是訓練比較困難,這主要是因為正樣本與負樣本(背景)極其不均衡,導致模型準確度稍低。我在 AI Studio 社區找到了 YOLO 和 SSD 的教程。YOLO 教程使用的數據集是自定義的螺絲螺母數據集,以下教程涵蓋了 YOLO v3 和 YOLO v3-tiny,不僅讓你能學好 YOLO,而且還提供了可以部署在低能耗設備上的模型。接下來要介紹的是 SSD。下面這個教程使用的是基于預訓練好的 mobile-net 訓練的 SSD,使用的數據集是 pascal-voc。關于計算機視覺的進階內容先介紹到這里,接下來介紹進階的 NLP 內容。還想學更高階的 CV 模型算法請移步到下一章。自然語言處理?(NLP)
項目地址:https://aistudio.baidu.com/aistudio/projectdetail/128857我們又回到了 NLP 技術領域了。假設我們已經學過前面爬豆瓣的那課, 我們獲取了某部著名電影的評論, 我們怎么知道它的口碑究竟如何呢? 通過這篇文章, 我們可以透過語言直接看到人類的情緒。不過為了方便起見,我們下面這個例子并不直接用之前采集的數據集,而是用的是已經處理好的 IMDB 電影數據集。詳情請查看《循環神經網絡 NLP-情感分類》。其實情感分類是一個很重要的技術,我之前做過對股票市場的情感分析算法,可以找出市場情感對股市走向的影響。不過如果你覺得情感分類還是太簡單的話,那恭喜你,你的進步是飛快的。那你接下來可以試試更難的,就是機器翻譯。飛槳框架收集了一個叫 WMT-14 的數據集,提供了 193319 條訓練數據和 6003 條測試數據,應該夠你探索的了。詳情請查看《深度學習進階 NLP-機器翻譯》。2. 高階學習者如何利用好AI studio
和前面一樣,還是分計算機視覺和NLP(自然語言處理)兩個主要方向來介紹項目。計算機視覺(CV)
分類識別還不夠?來個人體姿態估計和追蹤的項目來轟炸一下你的大腦吧。下面這個項目是嘗試復現論文 Simple Baselines for Human Pose Estimation and Tracking?里的結構。項目名:《人體姿態估計與追蹤之關鍵點檢測》。接下來介紹一個激動人心的技術:GAN。生成對抗網絡(Generative Adversarial Network,簡稱 GAN)是一種非監督學習的方式,通過讓兩個神經網絡相互博弈的方法進行學習。
GAN 由一個生成網絡和一個判別網絡組成,生成網絡從潛在的空間(latent space)中隨機采樣作為輸入,其輸出結果需要盡量模仿訓練集中的真實樣本。判別網絡的輸入為真實樣本或生成網絡的輸出,其目的是將生成網絡的輸出從真實樣本中盡可能的分辨出來。而生成網絡則盡可能地欺騙判別網絡,兩個網絡相互對抗,不斷調整參數。生成對抗網絡常用于生成以假亂真的圖片。此外,該方法還被用于生成影片,三維物體模型等。我們將利用 GAN,做個圖像風格遷移的項目:《風格遷移之圖像翻譯?Pix2Pix》。
自然語言處理(NLP)
現在對話聊天機器人是很火的方向。但是要使得聊天機器人表現得懂用戶,那就需要識別對話情緒。專注于識別智能對話場景中用戶的情緒。在這方面百度發布了自己的模型 ERNIE。通過建模海量數據中的詞、實體及實體關系,學習真實世界的語義知識。相較于 BERT 學習原始語言信號,ERNIE 直接對先驗語義知識單元進行建模,增強了模型語義表示能力。下面這個項目將帶你學習 ERNIE:《ERNIE 對話情緒識別》。之前我們講過語言情感分類和語言翻譯,你會覺得這不是很簡單嗎,對機器來說小兒科。但如果讓機器來做閱讀理解呢,或者讓機器去回答問題呢,有想過嗎?有個模型的提出讓以上這些問題都有了希望,這個模型就是 BERT(Bidirectional Encoder Representations from Transformers)。想知道 BERT 是什么,怎么工作的?下面這個項目能幫到你:《語義表示模型BERT》。機器閱讀理解(MRC)是自然語言處理(NLP)中的關鍵任務之一,需要機器對語言有深刻的理解才能找到正確的答案。機器閱讀理解領域有個著名的模型叫 BiDAF 模型 Bi-Directional Attention Flow for Machine Comprehension。下面這個項目將會幫助你了解更多:《機器閱讀理解之?BiDAF 模型》。3. 其他AI Studio上的學習項目
由于 CV 和 NLP 是熱門研究領域,以上項目都只提到 CV 和 NLP。但深度學習的研究范圍和應用范圍很廣,只是限于篇幅原因不能一一詳盡。為了照顧到更多領域的讀者,以下還收集了一些推薦算法的 AI Studio 的項目,這里僅列舉一下,不再一一介紹。有興趣的讀者可以研究下。基于飛槳PaddlePaddle的SR-GNN推薦算法
https://aistudio.baidu.com/aistudio/projectdetail/124382
個性化推薦之多視角Simnet模型
https://aistudio.baidu.com/aistudio/projectdetail/122294
飛槳PaddlePaddle分布式推薦算法實踐
https://aistudio.baidu.com/aistudio/projectdetail/124378
用飛槳PaddlePaddle實現個性化推薦
https://aistudio.baidu.com/aistudio/projectdetail/127567
標簽推薦算法之TagSpace
https://aistudio.baidu.com/aistudio/projectdetail/122298
推薦算法gru4rec之飛槳PaddlePaddle實現
https://aistudio.baidu.com/aistudio/projectdetail/122296
意猶未盡,還需要找更多的 AI Studio 深度學習項目?或者遇到問題不知道怎么解決?可以去下面兩個地方尋找幫助。
項目合集頁,在這里有很多官方和其他機器學習愛好者發布的項目:
https://aistudio.baidu.com/aistudio/projectoverview/public/1
論壇社區,如果你出現難解的問題,不妨上來看看有沒人遇到過同樣的情況:
https://ai.baidu.com/forum/topic/list/192
4小結
本文介紹了一個免費贈送 GPU 算力的深度學習平臺 AI Studio。首先介紹了 AI Studio 是什么,在性能上有什么優勢,同時也介紹了如何獲得免費 GPU 算力。最后用大量的篇幅介紹了如何利用好 AI Studio 上的學習資源,實現深度學習從入門到高階。?
現在每天贈送 24 小時算力,簡直是天上掉下的羊毛,不薅白不薅。羊毛不是天天有,該出手時就出手!?
點擊“閱讀原文”或打開以下鏈接查看所有項目:
https://aistudio.baidu.com/aistudio/messagedetail/42
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 訪問AI Studio
總結
以上是生活随笔為你收集整理的如何用免费GPU学习AI算法?这篇算法资源大集锦别错过的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 指导一下高二的青少年还可以长高5厘米吗?
- 下一篇: 旱烟和香烟哪个危害大?