2018年AI和ML(NLP、计算机视觉、强化学习)技术总结和2019年趋势(下)
?4、工具和庫
工具和庫是數據科學家的基礎。我參與了大量關于哪種工具最好的辯論,哪個框架會取代另一個,哪個庫是經濟計算的縮影等等。
但有一點共識--我們需要掌握該領域的最新工具,否則就有被淘汰的風險。?Python取代其他所有事物并將自己打造成行業領導者的步伐就是這樣的例子。?當然,其中很多都歸結為主觀選擇,但如果你不考慮最先進的技術,我建議你現在開始,否則后果可能將不可預測。那么成為今年頭條新聞的是什么?我們來看看吧!
PyTorch 1.0
什么是PyTorch?我已經多次在本文中提到它了,你可以在Faizan Shaikh的文章中熟悉這個框架。
這是我最喜歡的關于深度學習文章之一!當時TensorFlow很緩慢,這為PyTorch打開了大門快速獲得深度學習市場。我在GitHub上看到的大部分代碼都是PyTorch實現的。這并非因為PyTorch非常靈活,而是最新版本(v1.0)已經大規模應用到許多Facebook產品和服務,包括每天執行60億次文本翻譯。PyTorch的使用率在2019年上升,所以現在是加入的好時機。
AutoML—自動機器學習
AutoML在過去幾年中逐漸取得進展。RapidMiner、KNIME、DataRobot和H2O.ai等公司都發布了非常不錯的產品,展示了這項服務的巨大潛力。你能想象在ML項目上工作,只需要使用拖放界面而無需編碼嗎?這種現象在未來并不太遙遠。但除了這些公司之外,ML / DL領域還有一個重要的發布-Auto Keras!
它是一個用于執行AutoML任務的開源庫。其背后的目的是讓沒有ML背景的領域專家進行深度學習。請務必在此處查看,它準備在未來幾年內大規模運行。
TensorFlow.js-瀏覽器中的深度學習
我們一直都喜歡在最喜歡的IDE和編輯器中構建和設計機器學習和深度學習模型。如何邁出一步,嘗試不同的東西?我將要介紹如何在你的網絡瀏覽器中進行深度學習!由于TensorFlow.js的發布,已成為現實。
TensorFlow.js主要有三個優點/功能:
1.使用JavaScript開發和創建機器學習模型;
2.在瀏覽器中運行預先存在的TensorFlow模型;
3.重新創建已有的模型;
2019年的AutoML趨勢
我個人特別關注AutoML,為什么?因為我認為未來幾年它將成為數據科學領域真正的游戲規則改變者。跟我有同樣想法的人是H2O.ai的Marios Michailidis、Kaggle Grandmaster,他們都對AutoML有很高期望:
機器學習繼續成為未來最重要的趨勢之一,鑒于其增長速度,自動化是最大化其價值的關鍵,是充分利用數據科學資源的關鍵。它可以應用到的領域是無限的:信用、保險、欺詐、計算機視覺、聲學、傳感器、推薦、預測、NLP等等,能夠在這個領域工作是一種榮幸。AutoML趨勢:
5、強化學習
如果我不得不選擇一個我看到的滲透更多領域的技術,那就是強化學習。除了不定期看到的頭條新聞之外,我還在社區中了解到,它太注重數學,并且沒有真正的行業應用程序可供專一展示。
雖然這在某種程度上是正確的,但我希望看到的是明年更多來自RL的實際用例。我在每月GitHub和Reddit排序系列中,我傾向于至少保留一個關于RL的存儲庫或討論,至少圍繞該主題的討論。
OpenAI已經發布了一個非常有用的工具包,可以讓初學者從這個領域開始。
OpenAI在深度強化學習中的應用
如果RL的研究進展緩慢,那么圍繞它的教育材料將會很少。但事實上,OpenAI已經開放了一些關于這個主題的精彩材料。他們稱這個項目為“Spinning Up in Deep RL”,你可以在這里閱讀所有相關內容。它實際上是非常全面RL的資源列表,這里有很多材料包括RL術語、如何成為RL研究者、重要論文列表、一個記錄完備的代碼存儲庫、甚至還有一些練習來幫助你入門。
如果你打算開始使用RL,那么現在開始!
Google Dopamine
為了加速研究并讓社區更多的參與強化學習,Google?AI團隊開源了Dopamine,這是一個TensorFlow框架,旨在通過它來使更靈活和可重復性來構建RL模型。
你可以在此GitHub存儲庫中找到整個訓練數據以及TensorFlow代碼(僅15個Python notebooks!)。這是在受控且靈活的環境中進行簡單實驗的完美平臺,聽起來像數據科學家的夢想。
2019年強化學習趨勢
Xander Steenbrugge是DataHack Summit的代表,也是ArxivInsights頻道的創始人,他非常擅長強化學習。以下是他對RL當前狀態的看法以及2019年的預期:
- 我目前看到RL領域的三個主要問題:
我相信前兩個問題可以通過與無監督表示學習相關的類似技術來解決。目前在RL中,我們正在使用稀疏獎勵信號訓練深度神經網絡,從原始輸入空間(例如像素)映射到端到端方式的動作(例如,使用反向傳播)。
- 我認為能夠促進強化學習快速發展的道路是利用無監督的表示學習(自動編碼器、VAE、GAN)將凌亂的高維輸入空間(例如像素)轉換為低維“概念”空間。
人工智能:符合倫理才更重要
想象一下由算法統治的世界,算法決定了人類采取的每一個行動。這不是一個美好的場景,對嗎?AI中的倫理規范是Analytics Vidhya一直熱衷于討論的話題。
今年有相當多的組織因為Facebook的劍橋分析公司丑聞和谷歌內部普遍關于設計武器新聞丑聞而遭受危機。沒有一個開箱即用的解決方案或一個適合所有解決方案來處理AI的倫理方面。它需要一種細致入微的方法,并結合領導層提出的結構化路徑。讓我們看看今年出現的重大政策:GDPR。
GDPR如何改變游戲規則
GDPR或通用數據保護法規肯定會對用于構建AI應用程序的數據收集方式產生影響。GDPR的作用是以確保用戶可以更好地控制他們的數據。那么這對AI有何影響?我們可以想象一下,如果數據科學家沒有數據(或足夠數據),那么構建任何模型都會還沒開始就失敗。
2019年的AI倫理趨勢預期
這是一個灰色的領域。就像我提到的那樣,沒有一個解決方案可以解決這個問題。我們必須聚集在一起,將倫理問題整合到AI項目中。那么我們怎樣才能實現這一目標呢?正如Analytics Vidhya的創始人兼首席執行官Kunal Jain在2018年DataHack峰會上的演講中所強調的那樣:我們需要確定一個其他人可以遵循的框架。
結束語
有影響力!這是2018年來描述AI最佳的詞匯。今年我成為ULMFiT的狂熱用戶,我也很期待BERT。
?
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。?
總結
以上是生活随笔為你收集整理的2018年AI和ML(NLP、计算机视觉、强化学习)技术总结和2019年趋势(下)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 常见Serialize技术探秘(Obje
- 下一篇: 用AI说再见!“辣眼睛”的买家秀