史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(一)
喵喵喵~大家元宵節(jié)快樂(lè)噢。有沒(méi)有要陪小夕出去看煙花的吖...
小夕借此給熱愛(ài)學(xué)習(xí)的喵喵們獻(xiàn)上這篇拙文,希望不要嫌棄哦~
還有,小夕畫(huà)的封面圖是不是很棒呀( ̄? ̄)
小夕發(fā)現(xiàn)現(xiàn)在想進(jìn)軍人工智能領(lǐng)域的程序yuan甚至少年少女喵好多呀,但是有幾只向我吐槽過(guò)網(wǎng)上的資料很多很雜,入門(mén)指導(dǎo)基本是雜而不實(shí),很容易讓人滿(mǎn)腔熱情的開(kāi)始,卻又一臉懵逼的放棄。于是小夕來(lái)拯救世界啦!~
小夕的車(chē)轍
小夕從大二開(kāi)始做人臉識(shí)別,后來(lái)發(fā)現(xiàn)很快遇到了瓶頸。于是開(kāi)始學(xué)機(jī)器學(xué)習(xí)理論,又很快遇到了瓶頸,于是又開(kāi)始補(bǔ)數(shù)學(xué)。補(bǔ)完數(shù)學(xué)又鉆模式識(shí)別,又被虐了,但還是辛苦的啃完了《模式分類(lèi)》。后來(lái)學(xué)深度學(xué)習(xí)。再后來(lái)不停的論文論文論文、代碼代碼代碼...
?
由于小夕是從工程出發(fā)然后到理論,再回工程的道路,小夕覺(jué)得這樣走的彎路挺大的。而且前期做工程的時(shí)候真的很懵逼,各種看不懂然后跳過(guò)。
所以小夕這里分享給大家的道路是從理論到工程的平坦上升的道路。當(dāng)然啦,理論中肯定會(huì)穿插代碼實(shí)踐。小夕希望這是一條靠譜的、沒(méi)有知識(shí)斷層的深度學(xué)習(xí)/機(jī)器學(xué)習(xí)的入門(mén)之路,希望能在真正意義上幫到大家。
前言
本指導(dǎo)適合于真正有志于鉆研機(jī)器學(xué)習(xí)(含深度學(xué)習(xí))、模式識(shí)別及其相關(guān)應(yīng)用領(lǐng)域的人。對(duì)于那種“1個(gè)月入門(mén)機(jī)器學(xué)習(xí)”的大忽悠學(xué)習(xí)模式,小夕這里沒(méi)有噢~
?
理論上說(shuō),完全小夕的整個(gè)入門(mén)指導(dǎo)后,應(yīng)對(duì)整個(gè)機(jī)器學(xué)習(xí)大框架、理論細(xì)節(jié)、工程能力都有了比較好的積累。
?
在此之后可以偏向工程,輕松玩TensorFlow、Caffe等DL框架,轉(zhuǎn)CV、NLP等應(yīng)用性更強(qiáng)的方向;也可以偏向理論,比較輕松的看看最新的paper,跟上學(xué)術(shù)界的最前沿。但是工程與理論不是絕對(duì)割裂的哦,偏工程也要看論文、補(bǔ)數(shù)學(xué),偏理論也要敲代碼、了解優(yōu)秀框架哦。
?
首先,在開(kāi)始之前,要確保有以下的理論基礎(chǔ):
語(yǔ)文能力最少達(dá)到初中水平。
英語(yǔ)能力最少要達(dá)到高中優(yōu)秀水平,盡量在大學(xué)四級(jí)水平之上。
數(shù)學(xué)最少達(dá)到高中水平,微積分一定得學(xué)過(guò)。
?
盡量有以下的工程基礎(chǔ)(這樣可以邊學(xué)邊練,體會(huì)更深的喵,但是不會(huì)也沒(méi)有關(guān)系的)
面向過(guò)程編程范式
常見(jiàn)數(shù)據(jù)結(jié)構(gòu)
常見(jiàn)算法思想及算法分析能力
?
然后小夕為了避免文章過(guò)長(zhǎng),將計(jì)劃截成了四五個(gè)階段。本文為第一階段。
階段一
線(xiàn)性代數(shù)
前置課程
中學(xué)代數(shù)
主參考資料
《線(xiàn)性代數(shù)應(yīng)該這樣學(xué)》(英文叫《Linear Algebra done right》)
輔助參考資料(有先后順序)
《Deep Learning》Bengio等,第二章(中譯本勉強(qiáng)能看,鏈接https://github.com/exacity/deeplearningbook-chinese?嗚嗚好想趕緊開(kāi)通原創(chuàng)功能插超鏈接);
Wiki百科(翻墻不用教吧...);
《矩陣分析與應(yīng)用》張賢達(dá)
重點(diǎn)內(nèi)容(無(wú)先后順序):
向量及向量空間
內(nèi)積與范數(shù)
線(xiàn)性映射
矩陣? ??
張成、線(xiàn)性相關(guān)、線(xiàn)性無(wú)關(guān)
特征值與特征向量
特征分解
高級(jí)內(nèi)容(最起碼要了解):
譜定理
奇異值分解(SVD)
矩陣的跡
行列式
學(xué)習(xí)方法
適當(dāng)參考小夕總結(jié)的重點(diǎn)內(nèi)容,細(xì)細(xì)的品味《線(xiàn)性代數(shù)應(yīng)該這樣學(xué)》(這本書(shū)真的棒呆了)。
對(duì)于書(shū)中依然理解不了的部分,參考其他輔助資料哦。另外如果大家有哪方面難以理解,可以告訴小夕,小夕會(huì)盡量解答,若有必要的話(huà)直接寫(xiě)一篇小文章幫助大家理解哦。
主要意義
線(xiàn)性代數(shù)是機(jī)器學(xué)習(xí)的不能更基礎(chǔ)的數(shù)學(xué)基礎(chǔ)。不僅僅是因?yàn)榫仃囀菣C(jī)器學(xué)習(xí)中運(yùn)算的基本單位,而且一些線(xiàn)性代數(shù)中的高級(jí)理論也被借鑒吸收到了機(jī)器學(xué)習(xí)算法中,比如用SVD(奇異值分解)來(lái)對(duì)特征降維,跡運(yùn)算可以加深對(duì)PCA及某些聚類(lèi)算法本質(zhì)的理解等。
Matlab
前置課程
線(xiàn)性代數(shù)
面向過(guò)程編程范式
主參考資料:
Coursera平臺(tái)斯坦福大學(xué)Andrew Ng的“機(jī)器學(xué)習(xí)”課程的Matlab章節(jié)的視頻及補(bǔ)充資料
Matlab內(nèi)嵌幫助文檔
輔助參考資料
Google
CSDN
StackOverFlow
重點(diǎn)內(nèi)容:
Matlab基本語(yǔ)法
矩陣運(yùn)算常用的內(nèi)置API(即用戶(hù)編程接口/函數(shù)接口)
學(xué)習(xí)方法
參考Coursera平臺(tái)“機(jī)器學(xué)習(xí)”課程的Matlab教學(xué)視頻及閱讀材料來(lái)掌握Matlab基礎(chǔ)知識(shí)。
養(yǎng)成使用Matlab內(nèi)嵌幫助文檔來(lái)學(xué)習(xí)新API的方法的習(xí)慣。例如在解釋器中可以用“help +命令”或“doc +命令”快速掌握某API的用法等。
多多總結(jié)積累常用的矩陣運(yùn)算API。
主要意義
利用Matlab入門(mén)和理解機(jī)器學(xué)習(xí)算法,可以很大限度的忽略編程語(yǔ)言語(yǔ)法特性對(duì)算法實(shí)現(xiàn)的影響,也就是說(shuō)語(yǔ)法對(duì)數(shù)學(xué)表示的還原度很高~這樣可以很輕松的打通數(shù)學(xué)到計(jì)算機(jī)算法的橋梁,對(duì)于以后深入學(xué)習(xí)機(jī)器學(xué)習(xí)的理論和代碼實(shí)現(xiàn)都大有裨益。
機(jī)器學(xué)習(xí)-上
前置課程
線(xiàn)性代數(shù)
微積分
Matlab
主參考資料:
Coursera平臺(tái)斯坦福大學(xué)Andrew Ng的“機(jī)器學(xué)習(xí)”課程
《數(shù)據(jù)挖掘?qū)д摗?/p>
重點(diǎn)內(nèi)容:
機(jī)器學(xué)習(xí)基本概念及應(yīng)用領(lǐng)域
回歸與分類(lèi)的概念
線(xiàn)性回歸模型(Linear regression model)
邏輯回歸模型(Logistic regression model)
淺層神經(jīng)網(wǎng)絡(luò)(Neural Network)
支持向量機(jī)(Support Vector Machine)
交叉驗(yàn)證思想及用途(Cross Validation)
聚類(lèi)的概念
K-Means模型
學(xué)習(xí)方法
乖乖的跟著Coursera課程計(jì)劃來(lái)就好,要認(rèn)真完成課后習(xí)題和編程題哦。若課程中的有些內(nèi)容實(shí)在沒(méi)有理解透,強(qiáng)烈建議參考《數(shù)據(jù)挖掘?qū)д摗分械南嚓P(guān)章節(jié)吶(這本書(shū)對(duì)于機(jī)器學(xué)習(xí)部分的講解很好喵)。
小夕注:?Matlab代碼實(shí)現(xiàn)中多多體會(huì)和建立“用矩陣運(yùn)算”解決問(wèn)題的思想,努力擺脫“循環(huán)套循環(huán)”的low做法。Coursera結(jié)束后,仔細(xì)閱讀《數(shù)據(jù)挖掘?qū)д摗分械牡?、5章。先跳過(guò)其中的決策樹(shù)和貝葉斯分類(lèi)器那一節(jié)(以后的計(jì)劃中會(huì)安排的哦),另外第五章的組合方法能看懂就看,看不懂也沒(méi)關(guān)系,放在以后還會(huì)深入學(xué)。
主要意義
Coursera上的“機(jī)器學(xué)習(xí)”課程中幾乎沒(méi)有涉及到概率統(tǒng)計(jì)的知識(shí),自然也沒(méi)有貝葉斯分類(lèi)器這個(gè)經(jīng)典統(tǒng)計(jì)模型。同時(shí)也沒(méi)有深入講解最優(yōu)化的知識(shí)。
不過(guò)這樣極大的降低了課程的難度,非常適合拿來(lái)快速接觸機(jī)器學(xué)習(xí)又不會(huì)受很大打擊。對(duì)于提升興趣,以及后續(xù)理論深入的學(xué)習(xí)真的很有幫助呀,小夕當(dāng)年就是看了這個(gè)視頻然后愛(ài)上了可愛(ài)的Andrew Ng,然后愛(ài)上了這一領(lǐng)域\(//?//)\。
而《數(shù)據(jù)挖掘?qū)д摗芬卜浅_m合新手入門(mén),講解的十分淺顯易懂,在Coursera課程結(jié)束后再根據(jù)這個(gè)復(fù)習(xí)一遍,效果會(huì)非常好的。下階段預(yù)告
概率論與數(shù)理統(tǒng)計(jì)
最優(yōu)化算法-上
機(jī)器學(xué)習(xí)-下
本文重點(diǎn)
?
記得推薦給身邊有需要的人哦,ta與小夕都會(huì)很感激您的~
?
...要哭哭了,最近都快沒(méi)人打賞了...對(duì)小夕的文章不夠滿(mǎn)意,記得在訂閱號(hào)主頁(yè)給小夕提意見(jiàn)哦~小夕真的很用心哦(。 ?︿ ?。)
總結(jié)
以上是生活随笔為你收集整理的史上最萌最认真的机器学习/深度学习/模式识别入门指导手册(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 阿里P8架构师谈:数据库、JVM、缓存、
- 下一篇: 深度学习在文本领域的应用