机器学习--机器学习的分类
監督學習(Supervised Learning)
在監督學習中,給定一組數據,我們知道正確的輸出結果應該是什么樣子,并且知道在輸入和輸出之間有著一個特定的關系。通過已有的訓練樣本(即已知數據以及其對應的輸出)去訓練得到一個最優模型(這個模型屬于某個函數的集合,最優則表示在某個評價準則下是最佳的),再利用這個模型將所有的輸入映射為相應的輸出
- 回歸(regression)
我們會預測一個連續值。也就是說我們試圖將輸入變量和輸出用一個連續函數對應起來;比如通過房地產市場的數據,預測一個給定面積的房屋的價格就是一個回歸問題。這里我們可以把價格看成是面積的函數,它是一個連續的輸出值。 - 分類(classification)
我們會預測一個離散值,我們試圖將輸入變量與離散的類別對應起來。比如:給定醫學數據,通過腫瘤的大小來預測該腫瘤是惡性瘤還是良性瘤(課程中給的是乳腺癌的例子),這就是一個分類問題,它的輸出是0或者1兩個離散的值。(0代表良性,1代表惡性)。分類問題的輸出可以多于兩個,比如在該例子中可以有{0,1,2,3}四種輸出,分別對應{良性, 第一類腫瘤, 第二類腫瘤, 第三類腫瘤}。
無監督學習
無監督學習,通俗的來說,就是給你一組數據,然后不告訴你有關數據的任何正確答案。然后問你:“你能在這些數據中找到一些有趣的結構嗎?” 這就是無監督學習問題。在無監督學習中給定的數據是和監督學習中給定的數據是不一樣的。在無監督學習中給定的數據沒有任何標簽或者說只有同一種標簽。
無監督學習與監督學習的區別
- 有監督學習方法必須要有訓練集與測試樣本。在訓練集中找規律,而對測試樣本使用這種規律。而非監督學習沒有訓練集,只有一組數據,在該組數據集內尋找規律。
- 有監督學習的方法就是識別事物,識別的結果表現在給待識別數據加上了標簽。因此訓練樣本集必須由帶標簽的樣本組成。而非監督學習方法只有要分析的數據集的本身,預先沒有什么標簽。如果發現數據集呈現某種聚集性,則可按自然的聚集性分類,但不予以某種預先分類標簽對上號為目的。
- 非監督學習方法在尋找數據集中的規律性,這種規律性并不一定要達到劃分數據集的目的,也就是說不一定要“分類”。
- 簡單來說,有監督學習,是給你學習的數據集,然后告訴你要干什么,但是不告訴你怎么干,要去學習怎么干!無監督學習,就是給你大量的數據,不告訴你要干什么,然后你自己玩,看你能找到什么不一樣的東西,一般來說就是聚類,通過每一類的特征反應這些數據的作用!
半監督學習
半監督學習(Semi-Supervised Learning,SSL)是模式識別和機器學習領域研究的重點問題,是監督學習與無監督學習相結合的一種學習方法。半監督學習使用大量的未標記數據,以及同時使用標記數據,來進行模式識別工作。當使用半監督學習時,將會要求盡量少的人員來從事工作,同時,又能夠帶來比較高的準確性,因此,半監督學習正越來越受到人們的重視。
遷移學習
隨著越來越多的機器學習應用場景的出現,而現有表現比較好的監督學習需要大量的標注數據,標注數據是一項枯燥無味且花費巨大的任務,所以遷移學習受到越來越多的關注。簡單來說就是把為任務 A 開發的模型作為初始點,重新使用在為任務 B 開發模型的過程中。遷移學習是通過從已學習的相關任務中轉移知識來改進學習的新任務,雖然大多數機器學習算法都是為了解決單個任務而設計的,但是促進遷移學習的算法的開發是機器學習社區持續關注的話題。 遷移學習對人類來說很常見,例如,我們可能會發現學習識別蘋果可能有助于識別梨,或者學習彈奏電子琴可能有助于學習鋼琴。
強化學習(reinforcement learning)
強化學習是智能體(Agent)以“試錯”的方式進行學習,通過與環境進行交互獲得的獎賞指導行為,目標是使智能體獲得最大的獎賞,強化學習不同于連接主義學習中的監督學習,主要表現在強化信號上,強化學習中由環境提供的強化信號是對產生動作的好壞作一種評價(通常為標量信號),而不是告訴強化學習系統RLS(reinforcement learning system)如何去產生正確的動作。由于外部環境提供的信息很少,RLS必須靠自身的經歷進行學習。通過這種方式,RLS在行動-評價的環境中獲得知識,改進行動方案以適應環境。
我們今天只講分類,稍后會詳細展開,關注我,我們一起學習,一起進步!
你這么菜我們憑什么關注你!
總結
以上是生活随笔為你收集整理的机器学习--机器学习的分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: html中block指的是什么意思
- 下一篇: Markdown中希腊字母与代码对应表