4种不同类别的机器学习概述
導讀:機器學習涉及方方面面的內容,包含許多不同類型的算法,其學習方式也不相同。我們將簡要介紹這些學習方式及其對應的情景。
作者:列奧納多·德·馬爾希(Leonardo De Marchi),勞拉·米切爾(Laura Mitchell)
來源:大數據DT(ID:hzdashuju)
我們可以根據算法執行學習的方式將它們分為以下不同類別:
有監督學習
無監督學習
半監督學習
強化學習
01 有監督學習
有監督學習是目前商業過程中最常見的機器學習形式。這些算法試圖找到映射輸入和輸出的函數的一個很好的近似。
為此,顧名思義,我們需要自己為算法提供輸入值和輸出值,并且嘗試找到一個能夠使預測值和實際輸出值之間誤差最小的函數。
學習階段稱為訓練(training)。模型經過訓練后,可以針對未見過的數據預測輸出。此階段通常被視為評分或預測,如圖1-1所示。
▲圖?1-1
02 無監督學習
無監督學習適用于未標記的數據,因此我們不需要實際的輸出值,僅需要輸入。它嘗試在數據中查找模式并根據這些共同屬性做出反應,將輸入劃分為多個不同聚類(如圖1-2所示)。
▲圖 1-2
通常,無監督學習通常與有監督學習結合使用,以減少輸入空間并將數據中的信號集中在較少數量的變量上,但無監督學習還有其他目標。從這個角度來看,當標記數據很昂貴或不太可靠時,無監督學習比有監督學習更適用。
常見的無監督學習技術有聚類(clustering)和主成分分析(Principal Component Analysis,PCA)、獨立成分分析(Independent Component Analysis,ICA),以及一些神經網絡,例如生成對抗網絡(Generative Adversarial Network,GAN)和自編碼器(Autoencoder,AE)。
03 半監督學習
半監督學習是介于有監督學習和無監督學習之間的一種技術。它可以說不屬于機器學習中一個單獨的類別,而只是有監督學習的一種泛化,但在這將其單獨列出是有用的。
其目的是通過將一些有標記的數據擴展到類似的未標記數據,從而降低收集標記數據的成本。我們把一些生成模型分類為半監督學習。
半監督學習可以分為直推學習和歸納學習。直推學習適用于推斷未標記數據的標簽,歸納學習適用于推斷從輸入到輸出的正確映射。
我們可以看到此過程與我們在學校學習的大多數過程相似。老師向學生展示一些例子,并讓學生回家完成作業。為了完成這些作業,他們需要進行泛化。
04 強化學習
強化學習(RL)是我們目前所見的最獨特的類別。這個概念非常有趣:該算法試圖找出一個策略來最大化獎勵總和。
該策略由使用它在環境中執行動作的智能體來學習。然后,環境返回反饋,智能體使用該反饋來改進其策略。反饋是對所執行動作的獎勵,可以是正數、空值或負數,如圖1-3所示。
▲圖?1-3
關于作者:列奧納多·德·馬爾希(Leonardo De Marchi),目前是Badoo的數據科學家主管,Badoo是世界上的大型交友網站之一,擁有超過4億名用戶。他也是ideai.io(一家專門從事機器學習培訓的公司)的首席教練,為大型機構和有活力的初創企業提供技術和管理培訓。他擁有人工智能專業碩士學位,曾在體育界擔任數據科學家。
勞拉·米切爾(Laura Mitchell),目前是Badoo的首席數據科學家。Laura在NLP、圖像分類和推薦系統等項目的交付方面具有豐富的實踐經驗,包括從最初的構思到產品化。她熱衷于學習新技術并緊跟行業趨勢。
本文摘編自《神經網絡設計與實現》,經出版方授權發布。
延伸閱讀《神經網絡設計與實現》
點擊上圖了解及購買
轉載請聯系微信:DoctorData
推薦語:本書是一本神經網絡實踐進階指南,適合對AI和深度學習感興趣并且想進一步提高技能的讀者閱讀。
劃重點????
干貨直達????
10本最火的中臺與數字化轉型圖書,朋友圈都在傳
終于有人把碳達峰、碳中和講明白了
終于找到了!AI學習路線圖——從零基礎到就業
終于有人把數據倉庫講明白了
更多精彩????
在公眾號對話框輸入以下關鍵詞
查看更多優質內容!
讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手
大數據?|?云計算?|?數據庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學習?|?深度學習?|?NLP
5G?|?中臺?|?用戶畫像?|?數學?|?算法?|?數字孿生
據統計,99%的大咖都關注了這個公眾號
????
總結
以上是生活随笔為你收集整理的4种不同类别的机器学习概述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 让AI学习AI:自动化机器学习的概述、发
- 下一篇: 微软著名程序员、歌手、NBA球队老板保罗