简单粗暴的入门机器学习
有很多小伙伴問(wèn)過(guò)我零基礎(chǔ)要怎么入門機(jī)器學(xué)習(xí)或者人工智能,今天來(lái)提煉一下,方便志同道合的朋友們參考。
記得我剛?cè)氪松蕉礈?zhǔn)備修煉的時(shí)候,就 Google 了好多這類的問(wèn)題,那時(shí)候覺(jué)得大家的建議好多呀,這條路看起來(lái)真長(zhǎng),那么多東西要學(xué),那么多書(shū)要看,那么多有用的課程要學(xué)。
現(xiàn)在我可以就自己走過(guò)的坑坑包包來(lái)推薦一條簡(jiǎn)單粗暴的路徑。
[step 1: 方向]
在行動(dòng)之前,先想好這幾個(gè)最基本的問(wèn)題,如果自己想不全都可以去搜一下,知乎上很多大拿的回答:
--1.為什么要學(xué)習(xí)機(jī)器學(xué)習(xí)或者人工智能呢?
我的話,很實(shí)在地說(shuō),就是不想被淘汰呀!最開(kāi)始就是這么一個(gè)感覺(jué)。?
官方一點(diǎn)的話,就是可以提高效率呀。?
廣泛的需求我并沒(méi)有去想,只是想解決一下自己的需求。?
譬如,不想做家務(wù),就弄個(gè)機(jī)器人給我做;不想做瑣事,就弄個(gè)智能助理給我做。
所以大家在開(kāi)始入洞之前,也要先想幾分鐘這個(gè)問(wèn)題:
eg:是想做數(shù)據(jù)科學(xué)還是人工智能開(kāi)發(fā)呢??
if Data Science:就多做 kaggle 上偏分析的項(xiàng)目?
if AI:再想想是自然語(yǔ)言處理還是圖像識(shí)別呢?
我覺(jué)得 NLP 和 CV 是最基礎(chǔ)的技術(shù),AI 主要還是看應(yīng)用領(lǐng)域,現(xiàn)在比較火的:自動(dòng)駕駛,聊天機(jī)器人,ARVR,智能家居,智能教育,等等,最基礎(chǔ)的就是看和理解么,當(dāng)然對(duì)于每個(gè)具體的方向,肯定是涉及到更多技術(shù)和具體的細(xì)節(jié)知識(shí)需要去學(xué)的,不過(guò)入門的話,這倆是基礎(chǔ)。可以選其一,有興趣也可以選倆。AI 主要還是跟實(shí)際應(yīng)用場(chǎng)景關(guān)聯(lián)起來(lái)意義才大,醫(yī)療,生物,氣象,教育,交通目前比較火,對(duì)某個(gè)領(lǐng)域感興趣可以專攻更深。
--2.機(jī)器學(xué)習(xí),人工智能,數(shù)據(jù)科學(xué)的關(guān)系?
為了確立明確的入口,最好是知道這三者的關(guān)系,方便大家做計(jì)劃時(shí)更專注一些?
大家可以去多看幾篇這樣的文章,可以很快地了解一下大綱。
我比較喜歡下面這個(gè)圖,因?yàn)樗€列出了其他幾個(gè)大的技能。?
來(lái)自這篇文章:http://www.cnblogs.com/DonJiang/p/5744535.html
從這個(gè)圖看,機(jī)器學(xué)習(xí)的基礎(chǔ)還是要看滴,雖然現(xiàn)在深度學(xué)習(xí)很流行,類似 Tensorflow 等平臺(tái)也可以直接把數(shù)據(jù)仍進(jìn)去,調(diào)用多種模型,變換網(wǎng)絡(luò)的層次等參數(shù),它就輸出結(jié)果,不過(guò)神經(jīng)網(wǎng)絡(luò)模型是只是機(jī)器學(xué)習(xí)的一種,不是全部。當(dāng)然開(kāi)始的話,完全可以跨過(guò)ML課程,去學(xué)用TF訓(xùn)練一個(gè)聊天機(jī)器人,分析情緒,翻譯器等等。
--3.多長(zhǎng)時(shí)間后想達(dá)到什么樣的目標(biāo)?
eg:1 年后找到 ML 工作?
then:簡(jiǎn)歷上需要相關(guān)項(xiàng)目 or 學(xué)歷背景?
對(duì)于很多已經(jīng)工作的伙伴,學(xué)歷如果不容易實(shí)現(xiàn)的話,可做好項(xiàng)目這一欄。?
then:在拉勾網(wǎng)等招聘網(wǎng)站上面找到感興趣的工作,去看相關(guān)工作描述,提取出需求的技能,列入學(xué)習(xí)清單,學(xué)習(xí)時(shí)間緊時(shí)可以挑相關(guān)的先重點(diǎn)學(xué)。
[step 2: 路線-步驟]
第一步確立方向后,假設(shè)你想做人工智能,并且是自然語(yǔ)言處理,以此為例:
入門路線的話,一點(diǎn)我只推薦一個(gè)吧,簡(jiǎn)單不會(huì)被嚇到,也是我經(jīng)驗(yàn)覺(jué)得比較高效的:
--1.語(yǔ)言:
推薦 python?
入門書(shū):learn python the hard way?
pkg 教程網(wǎng)站:python scikit-learn?
當(dāng)然還需要 numpy,matplotlib,pandas 等常用包,scikit 是介紹算法多一些,可直接看
--2.課程:
Coursera 上吳恩達(dá)的是我覺(jué)得比較基礎(chǔ)且系統(tǒng)的,但它用matlab,大家可以直接換成 python 去敲代碼。Udacity 上的機(jī)器學(xué)習(xí)課程是用 Python 做的。
--3.書(shū):
周志華的西瓜書(shū)《機(jī)器學(xué)習(xí)》
--4.自然語(yǔ)言處理基礎(chǔ):
課程:cs224d?
如果是圖像處理,課程:cs231n
--5.小項(xiàng)目:
數(shù)據(jù)科學(xué):Kaggle 上很多好玩的比賽,開(kāi)腦洞+實(shí)戰(zhàn)?
人工智能:建議找個(gè)感興趣的小方向,實(shí)際做出來(lái)一個(gè),例如做一個(gè)自動(dòng)會(huì)創(chuàng)作音樂(lè)的小程序
--6.螺旋式升級(jí):
我覺(jué)得最有意思的就是在第5步,這期間就會(huì)發(fā)現(xiàn)還有好多關(guān)聯(lián)東西需要學(xué),所以就邊學(xué)邊戰(zhàn)吧
[Tips]
2017 可以給自己定個(gè)小目標(biāo),一個(gè)月拿下一步,升一級(jí),醬紫至多 5 個(gè)月后你就可以有自己的AI了。
上面幾步,大家完全可以根據(jù)自己的喜好,在搜索引擎提供的結(jié)果中,選擇適合自己的資源和節(jié)奏。
我覺(jué)得最有效的就是從實(shí)戰(zhàn)中學(xué)習(xí),但是理論也是必不可少的。
每一步先只選一個(gè),適合自己的資源,就開(kāi)始好好學(xué)。
上面只是一小步,離精深還遠(yuǎn)。
[關(guān)于阻礙]
大家擔(dān)心比較多的問(wèn)題就是,數(shù)學(xué)不記得了還能學(xué)么?
我覺(jué)得,暫時(shí)不要緊,可以直接看 scikit,里面有代碼的 demo,知道套路可以用,先用上就會(huì)很有成就感。?
里面文檔不懂得,例如哪些參數(shù)什么意思呀,怎么調(diào)呀,也可以找搜索引擎幫助。?
不過(guò)面試的話,對(duì)模型的原理,推導(dǎo),細(xì)節(jié)還是要把握好的。
大家都說(shuō)成長(zhǎng)最快的方式,就是找這個(gè)領(lǐng)域的牛人學(xué)習(xí)。對(duì)于這種學(xué)習(xí),如果沒(méi)辦法做到直接的,在線的,看他的書(shū)呀,聽(tīng)他的課呀,都算是學(xué)習(xí)。
總結(jié)
以上是生活随笔為你收集整理的简单粗暴的入门机器学习的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: cdev_init() / cedev_
- 下一篇: 机器学习、人工智能 博文链接汇总