1.什么是机器学习
機(jī)器學(xué)習(xí)是一幫計(jì)算機(jī)科學(xué)家想讓計(jì)算機(jī)像人一樣思考,所研發(fā)出來(lái)的計(jì)算機(jī)理論。
在計(jì)算機(jī)科學(xué)家眼里看來(lái),人和計(jì)算機(jī)其實(shí)并沒(méi)有差別。同樣都是一大批互相連接的 信息傳遞和存儲(chǔ)元素所組成的系統(tǒng)。所以有了這樣的想法,加上那批科學(xué)家得天獨(dú)厚的數(shù)學(xué)功底,機(jī)器學(xué)習(xí)的前身也有孕育而生了,機(jī)器學(xué)習(xí)的萌芽誕生于19世紀(jì)60年代。20年前逐漸興起,它是一門(mén)跨學(xué)科的交融。這里面包含了概率論,統(tǒng)計(jì)學(xué)等等學(xué)科。
隨著計(jì)算機(jī)硬件的提升,計(jì)算機(jī)運(yùn)算速度的不斷提高,它真正開(kāi)始進(jìn)入到我們的日常生活當(dāng)中,而在不久的將來(lái),我相信它也會(huì)成為我們生活中必不可少的組成元素。
我們說(shuō)一說(shuō)日常生活中的機(jī)器學(xué)習(xí)的應(yīng)用
第一個(gè)提到的,最具代表性的公司 應(yīng)該就是GOOGLE,它所開(kāi)發(fā)的google now,google photos都是基于機(jī)器學(xué)習(xí)的產(chǎn)物。與此同時(shí),各種各樣的企業(yè)都開(kāi)始嘗試把自己的產(chǎn)品往機(jī)器學(xué)習(xí)上靠攏。比如金融公司的匯率預(yù)測(cè),股票漲跌,房地產(chǎn)公司的房?jī)r(jià)預(yù)測(cè)等等。
機(jī)器學(xué)習(xí)不僅僅只有一種方法。實(shí)現(xiàn)它的方法多種多樣,這里所說(shuō)的方法,在程序語(yǔ)言中,我們叫做算法。目前所有機(jī)器學(xué)習(xí)的算法大概可以被分為4到5類。
如果在學(xué)習(xí)過(guò)程中,我們不斷的向計(jì)算機(jī)提供數(shù)據(jù)和這些數(shù)據(jù)所對(duì)應(yīng)的值。比如給計(jì)算機(jī)看貓和狗的圖片,并告訴計(jì)算機(jī)哪個(gè)是貓,哪個(gè)是狗,這種學(xué)習(xí)的方式就叫做“監(jiān)督學(xué)習(xí)(supervised learning)”
大家所熟知的神經(jīng)網(wǎng)絡(luò)同樣是一種監(jiān)督學(xué)習(xí)的方式。
但如果同樣在這種學(xué)習(xí)過(guò)程中,我只給計(jì)算機(jī)提供貓和狗的圖片,但并不告訴計(jì)算機(jī)哪些是貓哪些是狗,而是讓計(jì)算機(jī)自己去判斷和分類,讓計(jì)算機(jī)自己總結(jié)出兩種圖片之間的不同之處,這就是一種“非監(jiān)督學(xué)習(xí)(unsupervised learning)”。在這一種學(xué)習(xí)過(guò)程中,我們可以不用提供數(shù)據(jù)所對(duì)應(yīng)的標(biāo)簽信息,計(jì)算機(jī)通過(guò)觀察各種數(shù)據(jù)之間的特性,會(huì)發(fā)現(xiàn)這些特性背后的規(guī)律。這些規(guī)律也就是非監(jiān)督方法所學(xué)到的東西。
還有一種方法綜合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的特征,這種叫做“半監(jiān)督學(xué)習(xí)(semi-supervised learning)”
它主要考慮如何利用少量有標(biāo)簽的樣本和大量沒(méi)有標(biāo)簽的樣本進(jìn)行訓(xùn)練和分類。
在規(guī)劃?rùn)C(jī)器人的行為準(zhǔn)則方面,一種機(jī)器學(xué)習(xí)方法叫做“強(qiáng)化學(xué)習(xí)(reinforcement learning)”,也就是把計(jì)算機(jī)丟到一個(gè)對(duì)于它完全陌生的環(huán)境或者讓它完成一項(xiàng)從未接觸過(guò)的任務(wù),它自己會(huì)嘗試各種手段,最后讓自己成功的適應(yīng)這一陌生的環(huán)境。或者學(xué)會(huì)完成這件任務(wù)的方法途徑。
還有一種和強(qiáng)化學(xué)習(xí)類似的學(xué)習(xí)方法,叫做遺傳算法(Geneticalgorithm),這一種是模擬我們熟知的進(jìn)化理論,淘汰弱者,適者生存。通過(guò)這樣的淘汰機(jī)制去選擇最優(yōu)的設(shè)計(jì)或模型。
總結(jié)
有數(shù)據(jù)和標(biāo)簽的 監(jiān)督學(xué)習(xí)
只有數(shù)據(jù)沒(méi)有標(biāo)簽的 非監(jiān)督學(xué)習(xí)
結(jié)合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的半監(jiān)督學(xué)習(xí)
從經(jīng)驗(yàn)中總結(jié)提升的強(qiáng)化學(xué)習(xí)
最后是和強(qiáng)化學(xué)習(xí)類似的,有著適者生存 不適者淘汰準(zhǔn)則的遺傳算法。
總結(jié)
- 上一篇: 117. Populating Next
- 下一篇: RN返回navigation方法