深入浅出:机器学习与人工智能代码的实现(1)
01 機(jī)器學(xué)習(xí)導(dǎo)論
機(jī)器學(xué)習(xí)是一幫計(jì)算機(jī)科學(xué)家想讓計(jì)算機(jī)像人一樣思考所研發(fā)出來的計(jì)算機(jī)理論。他們?cè)?jīng)說過,人和計(jì)算機(jī)其實(shí)沒有差別,同樣都是一大批互相連接的信息傳遞和存儲(chǔ)元素所組成的系統(tǒng),所有有了這樣的想法,加上他們得天獨(dú)厚的數(shù)學(xué)功底,機(jī)器學(xué)習(xí)的前身也就孕育而生了。機(jī)器學(xué)習(xí)的萌芽誕生于19世界60年代,20年前開始逐漸興起,它是一門跨學(xué)科的交融,這里面包含了概率論、統(tǒng)計(jì)學(xué)等等學(xué)科。隨著計(jì)算機(jī)硬件的提升,計(jì)算機(jī)運(yùn)算速度的不斷提高,它真正開始進(jìn)入我們的日常生活中。而在不久的將來,我相信它也會(huì)成為我們生活中比不可少的組成元素。
02 機(jī)器學(xué)習(xí)應(yīng)用
第一個(gè)提到的,最具代表性的公司應(yīng)該就是GOOGLE,它所研發(fā)的GOOGLE NOW,GOOGLE PHOTOS 都是基于機(jī)器學(xué)習(xí)的產(chǎn)物。同樣在百度,圖片識(shí)別也是應(yīng)用到機(jī)器學(xué)習(xí)中的視覺處理系統(tǒng)。于此同時(shí),各種各樣的企業(yè)都開始嘗試把自己的產(chǎn)品往機(jī)器學(xué)習(xí)上靠攏。 比如金融公司的匯率預(yù)測,股票漲跌,房地產(chǎn)公司的房價(jià)預(yù)測等等。機(jī)器學(xué)習(xí)不僅僅只有一種方法,實(shí)現(xiàn)它的方法多種多樣,這里所說的方法,在程序語言中,我們叫做算法。
03 什么是監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)與半監(jiān)督學(xué)習(xí)
目前所有的機(jī)器學(xué)習(xí)算法大概可以被分為 4 到 5 類,如果在學(xué)習(xí)過程中,我們不斷的向計(jì)算機(jī)提供數(shù)據(jù)和這些數(shù)據(jù)所對(duì)應(yīng)的值,比如給計(jì)算機(jī)看貓和狗的圖片,告訴計(jì)算機(jī)哪些圖片里的是貓,哪些是狗,然后讓它學(xué)習(xí)去分辨貓和狗。通過這種指引的方式,讓計(jì)算機(jī)學(xué)習(xí)我們是如何把這些圖片數(shù)據(jù)對(duì)應(yīng)上圖片所代表的物體,也就是讓計(jì)算機(jī)學(xué)習(xí)這些標(biāo)簽可以代表哪些圖片,這種方式就叫做 “監(jiān)督學(xué)習(xí)(SUPERVISED LEARNING)” 。預(yù)測房屋的價(jià)格,股票的漲停同樣可以用監(jiān)督學(xué)習(xí)來實(shí)現(xiàn),大家所熟知的神經(jīng)網(wǎng)絡(luò)同樣是一種監(jiān)督學(xué)習(xí)的方式。
如果同樣在這種學(xué)習(xí)過程中,我們只給計(jì)算機(jī)提供貓和狗的圖片,但是并沒有告訴它哪些是貓,哪些是狗,取而代之的是,我讓它自己去判斷和分類,讓它自己總結(jié)出這兩種類型的圖片的不同之處,這就是一種 “非監(jiān)督學(xué)習(xí)(UN-SUPERVISED LEARNING)”。在這一種學(xué)習(xí)過程中,我們可以不用提供數(shù)據(jù)所對(duì)應(yīng)的標(biāo)簽信息,計(jì)算機(jī)通過觀察各種數(shù)據(jù)之間的特性,會(huì)發(fā)現(xiàn)這些特征背后的規(guī)律,這些規(guī)律也就是非監(jiān)督方法所學(xué)到的東西。
還有一種方法綜合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的特征,這種叫作 “半監(jiān)督學(xué)習(xí)(SEMI - SUPERVISED LEARNING)”。它主要考慮如何利用少量有標(biāo)簽的樣本和大量的沒有標(biāo)簽樣本進(jìn)行訓(xùn)練和分類。
04 什么是強(qiáng)化學(xué)習(xí)
在規(guī)劃機(jī)器人的行為準(zhǔn)則方面,一種機(jī)器學(xué)習(xí)方法叫作 “強(qiáng)化學(xué)習(xí)(REINFORCEMENT LEARNING)”。也就是把計(jì)算機(jī)丟到了一個(gè)對(duì)于它完全陌生的環(huán)境或者讓它完成一項(xiàng)從未接觸過的任務(wù),它自己會(huì)去嘗試各種手段,最后讓自己成功適應(yīng)這一個(gè)陌生環(huán)境,或者學(xué)會(huì)完成這件任務(wù)的方法途徑,比如說我想訓(xùn)練機(jī)器人去投籃,我只需要給它一個(gè)球,告訴它你投進(jìn)了我給你記一分,讓它自己去嘗試各種各樣的投籃方法,在開始階段,它的命中率可能會(huì)非常低,不過它會(huì)像人類一樣自己總結(jié)和學(xué)習(xí)投籃失敗或成功的經(jīng)驗(yàn),最后達(dá)到很高的命中率。GOOGLE 開發(fā)的 ALPHAGO 也就是應(yīng)用了這種學(xué)習(xí)方式。
05 什么是遺傳算法
還有一種和強(qiáng)化學(xué)習(xí)類似的學(xué)習(xí)方法,叫做遺傳算法(GENETICALGORITHM),這一種方法是模擬我們熟知的進(jìn)化理論,淘汰弱者,適者生存。通過這樣的淘汰機(jī)制去選擇最優(yōu)的設(shè)計(jì)或模型,比如網(wǎng)上有一位開發(fā)者所開發(fā)的計(jì)算機(jī)學(xué)會(huì)玩超級(jí)瑪麗,最開始的馬里奧1代可能不久就犧牲了,不過計(jì)算機(jī)系統(tǒng)會(huì)基于1代的馬里奧隨機(jī)生成2代,然后在保存這些代里最厲害的馬里奧,淘汰掉比較弱的馬里奧代,然后再次基于強(qiáng)者“繁衍和變異”生出更強(qiáng)的馬里奧,這也就是遺傳算法的基本思想。
06 總結(jié)
以上就是當(dāng)今比較重要的機(jī)器學(xué)習(xí)方法,我們?cè)賮砜偨Y(jié)一下,他們包括,有數(shù)據(jù)和標(biāo)簽的監(jiān)督學(xué)習(xí);沒有數(shù)據(jù),沒有標(biāo)簽的非監(jiān)督學(xué)習(xí);有結(jié)合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的半監(jiān)督學(xué)習(xí);還有從經(jīng)驗(yàn)中總結(jié)提升的強(qiáng)化學(xué)習(xí),最后是和強(qiáng)化學(xué)習(xí)類似的,有著適者生存,不適合淘汰準(zhǔn)則的遺傳算法。
總結(jié)
以上是生活随笔為你收集整理的深入浅出:机器学习与人工智能代码的实现(1)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: tiny4412 驱动 (16)apla
- 下一篇: java http异步调用_HttpCl