机器学习入门资源--汇总
機(jī)器學(xué)習(xí)入門(mén)資源--匯總
?
基本概念
機(jī)器學(xué)習(xí)?機(jī)器學(xué)習(xí)是近20多年興起的一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科。機(jī)器學(xué)習(xí)理論主要是設(shè)計(jì)和分析一些讓計(jì)算機(jī)可以自動(dòng)“學(xué)習(xí)”的算法。機(jī)器學(xué)習(xí)算法是一類從數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行預(yù)測(cè)的算法。因?yàn)閷W(xué)習(xí)算法中涉及了大量的統(tǒng)計(jì)學(xué)理論,機(jī)器學(xué)習(xí)與統(tǒng)計(jì)推斷學(xué)聯(lián)系尤為密切,也被稱為統(tǒng)計(jì)學(xué)習(xí)理論。算法設(shè)計(jì)方面,機(jī)器學(xué)習(xí)理論關(guān)注可以實(shí)現(xiàn)的,行之有效的學(xué)習(xí)算法。
下面從微觀到宏觀試著梳理一下機(jī)器學(xué)習(xí)的范疇:一個(gè)具體的算法,領(lǐng)域進(jìn)一步細(xì)分,實(shí)戰(zhàn)應(yīng)用場(chǎng)景,與其他領(lǐng)域的關(guān)系。
圖1: 機(jī)器學(xué)習(xí)的例子:NLTK監(jiān)督學(xué)習(xí)的工作流程圖 (source:?http://www.nltk.org/book/ch06.html)
圖2: 機(jī)器學(xué)習(xí)概要圖 by Yaser Abu-Mostafa (Caltech) (source:?http://work.caltech.edu/library/181.html)
圖3: 機(jī)器學(xué)習(xí)實(shí)戰(zhàn):在python scikit learn 中選擇機(jī)器學(xué)習(xí)算法 by Nishant Chandra (source:?http://n-chandra.blogspot.com/2013/01/picking-machine-learning-algorithm.html)
圖4: 機(jī)器學(xué)習(xí)和其他學(xué)科的關(guān)系: 數(shù)據(jù)科學(xué)的地鐵圖 by Swami Chandrasekaran (source:?http://nirvacana.com/thoughts/becoming-a-data-scientist/)
?
入門(mén)攻略
大致分三類: 起步體悟,實(shí)戰(zhàn)筆記,行家導(dǎo)讀
-
機(jī)器學(xué)習(xí)入門(mén)者學(xué)習(xí)指南 @果殼網(wǎng)?(2013) 作者?白馬?-- [起步體悟] 研究生型入門(mén)者的親身經(jīng)歷
-
有沒(méi)有做機(jī)器學(xué)習(xí)的哥們?能否介紹一下是如何起步的 @ourcoders?-- [起步體悟] 研究生型入門(mén)者的親身經(jīng)歷,尤其要看reyoung的建議
-
tornadomeet 機(jī)器學(xué)習(xí) 筆記?(2013) -- [實(shí)戰(zhàn)筆記](méi) 學(xué)霸的學(xué)習(xí)筆記,看看小伙伴是怎樣一步一步地掌握“機(jī)器學(xué)習(xí)”
-
Machine Learning Roadmap: Your Self-Study Guide to Machine Learning?(2014) Jason Brownlee -- [行家導(dǎo)讀] 雖然是英文版,但非常容易讀懂。對(duì)Beginner,Novice,Intermediate,Advanced讀者都有覆蓋。
- A Tour of Machine Learning Algorithms?(2013) 這篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章也非常好
- Best Machine Learning Resources for Getting Started(2013) 這片有中文翻譯?機(jī)器學(xué)習(xí)的最佳入門(mén)學(xué)習(xí)資源 @伯樂(lè)在線?譯者?programmer_lin
-
門(mén)主的幾個(gè)建議
- 既要有數(shù)學(xué)基礎(chǔ),也要編程實(shí)踐
- 別怕英文版,你不懂的大多是專業(yè)名詞,將來(lái)不論寫(xiě)文章還是讀文檔都是英文為主
- [我是小廣告][我是小廣告]訂閱機(jī)器學(xué)習(xí)日?qǐng)?bào),跟蹤業(yè)內(nèi)熱點(diǎn)資料。
更多攻略
- 機(jī)器學(xué)習(xí)該怎么入門(mén) @知乎?(2014)
- What's the easiest way to learn machine learning @quora?(2013)
- What is the best way to study machine learning @quora?(2012)
- Is there any roadmap for learning Machine Learning (ML) and its related courses at CMU Is there any roadmap for learning Machine Learning (ML) and its related courses at CMU?(2014)
課程資源
Tom Mitchell 和 Andrew Ng 的課都很適合入門(mén)
入門(mén)課程
2011 Tom Mitchell(CMU)機(jī)器學(xué)習(xí)
英文原版視頻與課件PDF?他的《機(jī)器學(xué)習(xí)》在很多課程上被選做教材,有中文版。
- Decision Trees
- Probability and Estimation
- Naive Bayes
- Logistic Regression
- Linear Regression
- Practical Issues: Feature selection,Overfitting ...
- Graphical models: Bayes networks, EM,Mixture of Gaussians clustering ...
- Computational Learning Theory: PAC Learning, Mistake bounds ...
- Semi-Supervised Learning
- Hidden Markov Models
- Neural Networks
- Learning Representations: PCA, Deep belief networks, ICA, CCA ...
- Kernel Methods and SVM
- Active Learning
- Reinforcement Learning 以上為課程標(biāo)題節(jié)選
2014 Andrew Ng (Stanford)機(jī)器學(xué)習(xí)
英文原版視頻?這就是針對(duì)自學(xué)而設(shè)計(jì)的,免費(fèi)還有修課認(rèn)證?!袄蠋熤v的是深入淺出,不用太擔(dān)心數(shù)學(xué)方面的東西。而且作業(yè)也非常適合入門(mén)者,都是設(shè)計(jì)好的程序框架,有作業(yè)指南,根據(jù)作業(yè)指南填寫(xiě)該完成的部分就行?!?#xff08;參見(jiàn)白馬同學(xué)的入門(mén)攻略)"推薦報(bào)名,跟著上課,做課后習(xí)題和期末考試。(因?yàn)橹豢床桓?#xff0c;啥都學(xué)不會(huì))。" (參見(jiàn)reyoung的建議)
進(jìn)階課程
2013年Yaser Abu-Mostafa (Caltech) Learning from Data?-- 內(nèi)容更適合進(jìn)階?課程視頻,課件PDF@Caltech
2014年 林軒田(國(guó)立臺(tái)灣大學(xué)) 機(jī)器學(xué)習(xí)基石 (Machine Learning Foundations)?-- 內(nèi)容更適合進(jìn)階,華文的教學(xué)講解?課程主頁(yè)
When Can Machines Learn? [何時(shí)可以使用機(jī)器學(xué)習(xí)] The Learning Problem [機(jī)器學(xué)習(xí)問(wèn)題] -- Learning to Answer Yes/No [二元分類] -- Types of Learning [各式機(jī)器學(xué)習(xí)問(wèn)題] -- Feasibility of Learning [機(jī)器學(xué)習(xí)的可行性]
Why Can Machines Learn? [為什麼機(jī)器可以學(xué)習(xí)] -- Training versus Testing [訓(xùn)練與測(cè)試] -- Theory of Generalization [舉一反三的一般化理論] -- The VC Dimension [VC 維度] -- Noise and Error [雜訊一錯(cuò)誤]
How Can Machines Learn? [機(jī)器可以怎麼樣學(xué)習(xí)] -- Linear Regression [線性迴歸] -- Linear `Soft' Classification [軟性的線性分類] -- Linear Classification beyond Yes/No [二元分類以外的分類問(wèn)題] -- Nonlinear Transformation [非線性轉(zhuǎn)換]
How Can Machines Learn Better? [機(jī)器可以怎麼樣學(xué)得更好] -- Hazard of Overfitting [過(guò)度訓(xùn)練的危險(xiǎn)] -- Preventing Overfitting I: Regularization [避免過(guò)度訓(xùn)練一:控制調(diào)適] -- Preventing Overfitting II: Validation [避免過(guò)度訓(xùn)練二:自我檢測(cè)] -- Three Learning Principles [三個(gè)機(jī)器學(xué)習(xí)的重要原則]
更多選擇
2008年Andrew Ng CS229 機(jī)器學(xué)習(xí)?-- 這組視頻有些年頭了,主講人這兩年也高大上了.當(dāng)然基本方法沒(méi)有太大變化,所以課件PDF可下載是優(yōu)點(diǎn)。?中文字幕視頻@網(wǎng)易公開(kāi)課?|?英文版視頻@youtube?|?課件PDF@Stanford
第1集.機(jī)器學(xué)習(xí)的動(dòng)機(jī)與應(yīng)用 第2集.監(jiān)督學(xué)習(xí)應(yīng)用.梯度下降 第3集.欠擬合與過(guò)擬合的概念 第4集.牛頓方法 第5集.生成學(xué)習(xí)算法 第6集.樸素貝葉斯算法 第7集.最優(yōu)間隔分類器問(wèn)題 第8集.順序最小優(yōu)化算法 第9集.經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化 第10集.特征選擇 第11集.貝葉斯統(tǒng)計(jì)正則化 第12集.K-means算法 第13集.高斯混合模型 第14集.主成分分析法 第15集.奇異值分解 第16集.馬爾可夫決策過(guò)程 第17集.離散與維數(shù)災(zāi)難 第18集.線性二次型調(diào)節(jié)控制 第19集.微分動(dòng)態(tài)規(guī)劃 第20集.策略搜索
2012年余凱(百度)張潼(Rutgers) 機(jī)器學(xué)習(xí)公開(kāi)課?-- 內(nèi)容更適合進(jìn)階?課程主頁(yè)@百度文庫(kù)?|?課件PDF@龍星計(jì)劃
第1節(jié)Introduction to ML and review of linear algebra, probability, statistics (kai) 第2節(jié)linear model (tong) 第3節(jié)overfitting and regularization(tong) 第4節(jié)linear classification (kai) 第5節(jié)basis expansion and kernelmethods (kai) 第6節(jié)model selection and evaluation(kai) 第7節(jié)model combination (tong) 第8節(jié)boosting and bagging (tong) 第9節(jié)overview of learning theory(tong) 第10節(jié)optimization in machinelearning (tong) 第11節(jié)online learning (tong) 第12節(jié)sparsity models (tong) 第13節(jié)introduction to graphicalmodels (kai) 第14節(jié)structured learning (kai) 第15節(jié)feature learning and deeplearning (kai) 第16節(jié)transfer learning and semi supervised learning (kai) 第17節(jié)matrix factorization and recommendations (kai) 第18節(jié)learning on images (kai) 第19節(jié)learning on the web (tong)
論壇網(wǎng)站
中文
http://www.52ml.net/?我愛(ài)機(jī)器學(xué)習(xí)
http://www.mitbbs.com/bbsdoc/DataSciences.html?MITBBS- 電腦網(wǎng)絡(luò) - 數(shù)據(jù)科學(xué)版
http://www.guokr.com/group/262/?果殼 > 機(jī)器學(xué)習(xí)小組
http://cos.name/cn/forum/22?統(tǒng)計(jì)之都 ? 統(tǒng)計(jì)學(xué)世界 ? 數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)
http://bbs.byr.cn/#!board/ML_DM?北郵人論壇?>>?學(xué)術(shù)科技?>>?機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘
英文
https://github.com/josephmisiti/awesome-machine-learning?機(jī)器學(xué)習(xí)資源大全
http://work.caltech.edu/library/?Caltech 機(jī)器學(xué)習(xí)視頻教程庫(kù),每個(gè)課題一個(gè)視頻
http://www.kdnuggets.com/?數(shù)據(jù)挖掘名站
http://www.datasciencecentral.com/?數(shù)據(jù)科學(xué)中心網(wǎng)站
東拉西扯
一些好東西,入門(mén)前未必看得懂,要等學(xué)有小成時(shí)再看才能體會(huì)。
機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘的區(qū)別
- 機(jī)器學(xué)習(xí)關(guān)注從訓(xùn)練數(shù)據(jù)中學(xué)到已知屬性進(jìn)行預(yù)測(cè)
- 數(shù)據(jù)挖掘側(cè)重從數(shù)據(jù)中發(fā)現(xiàn)未知屬性
Dan Levin, What is the difference between statistics, machine learning, AI and data mining?
- If there are up to 3 variables, it is statistics.
- If the problem is NP-complete, it is machine learning.
- If the problem is PSPACE-complete, it is AI.
- If you don't know what is PSPACE-complete, it is data mining.
幾篇高屋建瓴的機(jī)器學(xué)習(xí)領(lǐng)域概論, 參見(jiàn)原文
- The Discipline of Machine LearningTom Mitchell 當(dāng)年為在CMU建立機(jī)器學(xué)習(xí)系給校長(zhǎng)寫(xiě)的東西。
- A Few Useful Things to Know about Machine Learning?Pedro Domingos教授的大道理,也許入門(mén)時(shí)很多概念還不明白,上完公開(kāi)課后一定要再讀一遍。
幾本好書(shū)
- 李航博士的《統(tǒng)計(jì)學(xué)習(xí)方法》一書(shū)前段也推薦過(guò),給個(gè)豆瓣的鏈接
?
2014-10-14版, 好東西傳送門(mén)編輯整理, 原文鏈接?http://ml.memect.com/article/machine-learning-guide.html
感謝貢獻(xiàn)者: tang_Kaka_back@新浪微博
歡迎補(bǔ)充指正,轉(zhuǎn)載請(qǐng)保留原作者和原文鏈接。 本文是?機(jī)器學(xué)習(xí)日?qǐng)?bào)的一個(gè)專題合集,歡迎訂閱:請(qǐng)給hao@memect.com發(fā)郵件,標(biāo)題"訂閱機(jī)器學(xué)習(xí)日?qǐng)?bào)"。
?
總結(jié)
以上是生活随笔為你收集整理的机器学习入门资源--汇总的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: mongodb[三] 文档操作:插入、
- 下一篇: css行高line-height的一些深