机器学习基础自学笔记2
????????以前看視頻看博客學習深度學習,總感覺心里慌慌的,找不到重點,感覺不是很系統。現在雖然學的也很渣,不過感覺沒那么慌了。教訓是要多看書,自己思考,思考不明白再查博客大牛怎么講的。希望我的感覺是對的吧。
1.1學習算法
? ? ? ? 機器學習算法是一種能夠從數據中學習的算法。Mitchell提供一個簡潔的定義:對于某類任務和性能度量P,一個計算機程序被認為可以從經驗E中學習是指,通過經驗E改進后,它在任務T上由性能度量P衡量的性能有所提升。通常機器學習任務定義為機器學習系統應該如何處理樣本(example),樣本指我們從某些希望機器學習系統處理的對象或事件中收集到的已經量化的特征(feature)的集合。一般將樣本表示成一個向量,向量的每一個元素是一個特征。
????????常見的機器學習任務T:分類,輸入缺失分類,回歸,轉錄,機器翻譯,結構化輸出,異常檢測,合成和采樣,缺失值補填,去噪,密度估計或概率質量函數估計。
? ? ? ? 性能度量P:對于分類、缺失輸入分類和轉錄任務通常用準確率或錯誤率來度量。性能度量的選擇看上去簡單且客觀,但是選擇一個與系統理想表現對應的性能度量通常是很難的。一些情況下,很難確定應該度量什么。在執行回歸任務時,是應該懲罰一些中等錯誤的系統還是較少犯錯但是犯大錯的系統?這卻決于具體情況。
? ? ? ? 經驗E:根據學習過程中的不同經驗,機器學習算法大致分為無監督算法和監督算法。大致來說,無監督學習涉及觀察隨機向量的好幾個樣本,試圖顯示或隱式地學習出概率分布;監督學習包含觀察隨機向量(x)極其相關聯值(y),然后從x估計y。監督學習(supervised learning)形象的描述為老師提供目標y給機器學習系統,指導其應該做什么。無監督學習中,沒有老師指導,算法必須學會在沒有指導的情況下理解數據。無監督學習和監督學習不是嚴格定義的術語,它們之間界限通常是很模糊的。盡管無監督學習和監督學習并非完全沒有交集的正式概念,它們確實有助于粗略分類我們研究機器學習算法時遇到的問題。傳統上,人們將回歸、分類或者結構化輸出問題稱為監督學習,將支持其他任務的密度估計稱為無監督學習。
1.2 容量、過擬合和欠擬合
? ? ? ? 機器學習的主要挑戰時算法必須能夠在先前未觀測到的新輸入上表現良好。這種在先前未觀測到的輸入上表現良好的能力稱為泛化(generalization)。未完待續。。。
總結
以上是生活随笔為你收集整理的机器学习基础自学笔记2的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习笔记1
- 下一篇: 杂谈——杭州考驾照历程