當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

深入浅出：机器学习与人工智能代码的实现（1）

發(fā)布時(shí)間：2024/3/24 编程问答 46 豆豆

生活随笔收集整理的這篇文章主要介紹了深入浅出：机器学习与人工智能代码的实现（1）小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

01 機(jī)器學(xué)習(xí)導(dǎo)論

機(jī)器學(xué)習(xí)是一幫計(jì)算機(jī)科學(xué)家想讓計(jì)算機(jī)像人一樣思考所研發(fā)出來的計(jì)算機(jī)理論。他們?cè)?jīng)說過，人和計(jì)算機(jī)其實(shí)沒有差別，同樣都是一大批互相連接的信息傳遞和存儲(chǔ)元素所組成的系統(tǒng)，所有有了這樣的想法，加上他們得天獨(dú)厚的數(shù)學(xué)功底，機(jī)器學(xué)習(xí)的前身也就孕育而生了。機(jī)器學(xué)習(xí)的萌芽誕生于19世界60年代，20年前開始逐漸興起，它是一門跨學(xué)科的交融，這里面包含了概率論、統(tǒng)計(jì)學(xué)等等學(xué)科。隨著計(jì)算機(jī)硬件的提升，計(jì)算機(jī)運(yùn)算速度的不斷提高，它真正開始進(jìn)入我們的日常生活中。而在不久的將來，我相信它也會(huì)成為我們生活中比不可少的組成元素。

02 機(jī)器學(xué)習(xí)應(yīng)用

第一個(gè)提到的，最具代表性的公司應(yīng)該就是GOOGLE，它所研發(fā)的GOOGLE NOW，GOOGLE PHOTOS 都是基于機(jī)器學(xué)習(xí)的產(chǎn)物。同樣在百度，圖片識(shí)別也是應(yīng)用到機(jī)器學(xué)習(xí)中的視覺處理系統(tǒng)。于此同時(shí)，各種各樣的企業(yè)都開始嘗試把自己的產(chǎn)品往機(jī)器學(xué)習(xí)上靠攏。 比如金融公司的匯率預(yù)測，股票漲跌，房地產(chǎn)公司的房價(jià)預(yù)測等等。機(jī)器學(xué)習(xí)不僅僅只有一種方法，實(shí)現(xiàn)它的方法多種多樣，這里所說的方法，在程序語言中，我們叫做算法。

03 什么是監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)與半監(jiān)督學(xué)習(xí)

目前所有的機(jī)器學(xué)習(xí)算法大概可以被分為 4 到 5 類，如果在學(xué)習(xí)過程中，我們不斷的向計(jì)算機(jī)提供數(shù)據(jù)和這些數(shù)據(jù)所對(duì)應(yīng)的值，比如給計(jì)算機(jī)看貓和狗的圖片，告訴計(jì)算機(jī)哪些圖片里的是貓，哪些是狗，然后讓它學(xué)習(xí)去分辨貓和狗。通過這種指引的方式，讓計(jì)算機(jī)學(xué)習(xí)我們是如何把這些圖片數(shù)據(jù)對(duì)應(yīng)上圖片所代表的物體，也就是讓計(jì)算機(jī)學(xué)習(xí)這些標(biāo)簽可以代表哪些圖片，這種方式就叫做 “監(jiān)督學(xué)習(xí)（SUPERVISED LEARNING）” 。預(yù)測房屋的價(jià)格，股票的漲停同樣可以用監(jiān)督學(xué)習(xí)來實(shí)現(xiàn)，大家所熟知的神經(jīng)網(wǎng)絡(luò)同樣是一種監(jiān)督學(xué)習(xí)的方式。

如果同樣在這種學(xué)習(xí)過程中，我們只給計(jì)算機(jī)提供貓和狗的圖片，但是并沒有告訴它哪些是貓，哪些是狗，取而代之的是，我讓它自己去判斷和分類，讓它自己總結(jié)出這兩種類型的圖片的不同之處，這就是一種 “非監(jiān)督學(xué)習(xí)（UN-SUPERVISED LEARNING）”。在這一種學(xué)習(xí)過程中，我們可以不用提供數(shù)據(jù)所對(duì)應(yīng)的標(biāo)簽信息，計(jì)算機(jī)通過觀察各種數(shù)據(jù)之間的特性，會(huì)發(fā)現(xiàn)這些特征背后的規(guī)律，這些規(guī)律也就是非監(jiān)督方法所學(xué)到的東西。

還有一種方法綜合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的特征，這種叫作 “半監(jiān)督學(xué)習(xí)（SEMI - SUPERVISED LEARNING）”。它主要考慮如何利用少量有標(biāo)簽的樣本和大量的沒有標(biāo)簽樣本進(jìn)行訓(xùn)練和分類。

04 什么是強(qiáng)化學(xué)習(xí)

在規(guī)劃機(jī)器人的行為準(zhǔn)則方面，一種機(jī)器學(xué)習(xí)方法叫作 “強(qiáng)化學(xué)習(xí)（REINFORCEMENT LEARNING）”。也就是把計(jì)算機(jī)丟到了一個(gè)對(duì)于它完全陌生的環(huán)境或者讓它完成一項(xiàng)從未接觸過的任務(wù)，它自己會(huì)去嘗試各種手段，最后讓自己成功適應(yīng)這一個(gè)陌生環(huán)境，或者學(xué)會(huì)完成這件任務(wù)的方法途徑，比如說我想訓(xùn)練機(jī)器人去投籃，我只需要給它一個(gè)球，告訴它你投進(jìn)了我給你記一分，讓它自己去嘗試各種各樣的投籃方法，在開始階段，它的命中率可能會(huì)非常低，不過它會(huì)像人類一樣自己總結(jié)和學(xué)習(xí)投籃失敗或成功的經(jīng)驗(yàn)，最后達(dá)到很高的命中率。GOOGLE 開發(fā)的 ALPHAGO 也就是應(yīng)用了這種學(xué)習(xí)方式。

05 什么是遺傳算法

還有一種和強(qiáng)化學(xué)習(xí)類似的學(xué)習(xí)方法，叫做遺傳算法（GENETICALGORITHM），這一種方法是模擬我們熟知的進(jìn)化理論，淘汰弱者，適者生存。通過這樣的淘汰機(jī)制去選擇最優(yōu)的設(shè)計(jì)或模型，比如網(wǎng)上有一位開發(fā)者所開發(fā)的計(jì)算機(jī)學(xué)會(huì)玩超級(jí)瑪麗，最開始的馬里奧1代可能不久就犧牲了，不過計(jì)算機(jī)系統(tǒng)會(huì)基于1代的馬里奧隨機(jī)生成2代，然后在保存這些代里最厲害的馬里奧，淘汰掉比較弱的馬里奧代，然后再次基于強(qiáng)者“繁衍和變異”生出更強(qiáng)的馬里奧，這也就是遺傳算法的基本思想。

06 總結(jié)

以上就是當(dāng)今比較重要的機(jī)器學(xué)習(xí)方法，我們?cè)賮砜偨Y(jié)一下，他們包括，有數(shù)據(jù)和標(biāo)簽的監(jiān)督學(xué)習(xí)；沒有數(shù)據(jù)，沒有標(biāo)簽的非監(jiān)督學(xué)習(xí)；有結(jié)合了監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)的半監(jiān)督學(xué)習(xí)；還有從經(jīng)驗(yàn)中總結(jié)提升的強(qiáng)化學(xué)習(xí)，最后是和強(qiáng)化學(xué)習(xí)類似的，有著適者生存，不適合淘汰準(zhǔn)則的遺傳算法。

總結(jié)

以上是生活随笔為你收集整理的深入浅出：机器学习与人工智能代码的实现（1）的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： tiny4412 驱动（16）apla
下一篇： java http异步调用_HttpCl