當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

机器学习算法概述——摘录《机器学习算法导论》

發(fā)布時(shí)間：2023/12/14 编程问答 45 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习算法概述——摘录《机器学习算法导论》小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

第一章機(jī)器學(xué)習(xí)算法概述

1.1什么是機(jī)器學(xué)習(xí)？

1.2機(jī)器學(xué)習(xí)的形式分類(lèi)

1.2.1 監(jiān)督式學(xué)習(xí)

1.2.2 無(wú)監(jiān)督學(xué)習(xí)

1.2.3強(qiáng)化學(xué)習(xí)

1.3 機(jī)器學(xué)習(xí)算法綜覽

第一章機(jī)器學(xué)習(xí)算法概述

人工只能的概念是由以麥卡賽、明斯基、羅切斯特和香農(nóng)等為首的一批科學(xué)家在1956年提出的。為何已有六十余年的歷史學(xué)科又一次進(jìn)入到人們視野的中心？是什么技術(shù)的突破，為人工智能領(lǐng)域注入了新鮮的活力?

人工智能的核心是機(jī)器學(xué)習(xí)，而機(jī)器學(xué)習(xí)的核心是算法！近年來(lái)，機(jī)器學(xué)習(xí)的算法，尤其是深度學(xué)習(xí)算法，展現(xiàn)出了無(wú)與倫比的威力，而且GPU（圖像處理器）的高速發(fā)展，使得大規(guī)模深度學(xué)習(xí)成為可能。正是機(jī)器學(xué)習(xí)算法和硬件技術(shù)的土坯使得人工智能煥發(fā)新生。

本書(shū)將要回答：機(jī)器如何通過(guò)學(xué)習(xí)獲取智能？機(jī)器學(xué)習(xí)算法和傳統(tǒng)算法有何不同？

本章先概述機(jī)器學(xué)習(xí)這領(lǐng)域。

1.1什么是機(jī)器學(xué)習(xí)？

機(jī)器學(xué)習(xí)是智能體通過(guò)模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為來(lái)獲得新的知識(shí)或技能，重新組織已有的知識(shí)結(jié)構(gòu)，以不斷改善自身智能。

給定任務(wù)T，相關(guān)的經(jīng)驗(yàn)E，關(guān)于學(xué)習(xí)效果的度量P，機(jī)器學(xué)習(xí)就是通過(guò)對(duì)經(jīng)驗(yàn)E的學(xué)習(xí)來(lái)優(yōu)化任務(wù)T完成效果度量P的一個(gè)過(guò)程。

舉例：無(wú)人駕駛汽車(chē)系統(tǒng)中，機(jī)器學(xué)習(xí)的任務(wù)就是根據(jù)路況確定駕駛方式；學(xué)習(xí)效果的度量可以是事故發(fā)生的概率；經(jīng)驗(yàn)是人類(lèi)大量的駕駛數(shù)據(jù)。

在機(jī)器學(xué)習(xí)中，用于學(xué)習(xí)的經(jīng)驗(yàn)數(shù)據(jù)為訓(xùn)練數(shù)據(jù)，完成任務(wù)的方法叫模型。機(jī)器學(xué)習(xí)的核心是設(shè)計(jì)出以訓(xùn)練數(shù)據(jù)為輸入，模型為輸出的算法。

1.2機(jī)器學(xué)習(xí)的形式分類(lèi)

常見(jiàn)的機(jī)器學(xué)習(xí)的形式分類(lèi)有兩種：無(wú)監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)。此外，還有介入兩者之間的形式——強(qiáng)化學(xué)習(xí)。

1.2.1 監(jiān)督式學(xué)習(xí)

在這類(lèi)機(jī)器學(xué)習(xí)的學(xué)習(xí)形式中，每一條訓(xùn)練數(shù)據(jù)含有兩部分信息：特征組和標(biāo)簽。一條訓(xùn)練數(shù)據(jù)中的特征組是對(duì)應(yīng)對(duì)象的特征的描述，而標(biāo)簽則是對(duì)象的一個(gè)屬性。監(jiān)督式學(xué)習(xí)的任務(wù)就是根據(jù)對(duì)象的特征組對(duì)標(biāo)簽的取值進(jìn)行預(yù)測(cè)。

舉例：手寫(xiě)數(shù)字識(shí)別。特征組是手寫(xiě)數(shù)字圖片的像素灰度矩陣，標(biāo)簽是圖片中的數(shù)字。

通常，有兩種獲取標(biāo)簽值的方式：1.人工標(biāo)注法。例如，電影推薦系統(tǒng)中，用戶(hù)給影片的評(píng)分便是訓(xùn)練數(shù)據(jù)的標(biāo)簽。2.數(shù)據(jù)自帶標(biāo)簽值。例如，搜索引擎中，點(diǎn)擊率越高的鏈接，應(yīng)當(dāng)排在前面。

根據(jù)訓(xùn)練數(shù)據(jù)所帶標(biāo)簽值的特性，又可將監(jiān)督式學(xué)習(xí)分為兩類(lèi)——分類(lèi)問(wèn)題和回歸問(wèn)題。

分類(lèi)問(wèn)題，是指標(biāo)簽值只取有限個(gè)可能值，對(duì)應(yīng)的監(jiān)督式學(xué)習(xí)。每個(gè)標(biāo)簽值代表一個(gè)類(lèi)，含有k個(gè)類(lèi)別的分類(lèi)問(wèn)題被稱(chēng)為k元分類(lèi)問(wèn)題。

分類(lèi)問(wèn)題的任務(wù)可分為兩種形式。第一種是要求對(duì)類(lèi)別有明確的預(yù)測(cè)；第二種是計(jì)算出給定對(duì)象屬于每一類(lèi)別的概率。

回歸問(wèn)題，是指標(biāo)簽取值為某個(gè)區(qū)間實(shí)數(shù)的監(jiān)督學(xué)習(xí)問(wèn)題。例如，房?jī)r(jià)預(yù)測(cè)中，訓(xùn)練數(shù)據(jù)包含房屋及相關(guān)具體特征和交易價(jià)格（標(biāo)簽值）。

上述兩類(lèi)監(jiān)督式學(xué)習(xí)問(wèn)題可以相互轉(zhuǎn)化，比如logistic回歸就是一種利用回歸方法求解分類(lèi)問(wèn)題的算法。

1.2.2 無(wú)監(jiān)督學(xué)習(xí)

訓(xùn)練數(shù)據(jù)不含標(biāo)簽。無(wú)監(jiān)督學(xué)習(xí)問(wèn)題的任務(wù)通常是對(duì)數(shù)據(jù)本身的模式識(shí)別與分類(lèi)。廣泛應(yīng)用于降維問(wèn)題和聚類(lèi)問(wèn)題。

降維問(wèn)題。機(jī)器學(xué)習(xí)中每條訓(xùn)練數(shù)據(jù)的特征組都可以用一個(gè)向量來(lái)表示。此向量的每個(gè)分量代表了對(duì)象的一個(gè)特征。實(shí)際應(yīng)用中，特征組的維度相當(dāng)高（甚至達(dá)百萬(wàn)數(shù)量級(jí)）時(shí)，眾多特征增加了求解問(wèn)題的復(fù)雜性，因此對(duì)高維度的特征組進(jìn)行低維近似，是降維問(wèn)題的主要應(yīng)用。降維問(wèn)題的另一個(gè)應(yīng)用便是數(shù)據(jù)可視化。

聚類(lèi)問(wèn)題。無(wú)監(jiān)督學(xué)習(xí)的聚類(lèi)問(wèn)題和有監(jiān)督學(xué)習(xí)的分類(lèi)問(wèn)題區(qū)別在于：聚類(lèi)問(wèn)題的任務(wù)僅限于對(duì)未知分類(lèi)的一批數(shù)據(jù)進(jìn)行聚類(lèi)，而分類(lèi)問(wèn)題是用已知分類(lèi)的訓(xùn)練數(shù)據(jù)訓(xùn)練出一個(gè)能夠預(yù)測(cè)數(shù)據(jù)類(lèi)別的模型。二者都是將數(shù)據(jù)按模式分類(lèi)。聚類(lèi)問(wèn)題常應(yīng)用于異常探測(cè)。聚類(lèi)算法將數(shù)據(jù)聚成兩類(lèi)——正常類(lèi)和異常類(lèi)。

1.2.3強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)是現(xiàn)代人工智能的重要課題，在博弈策略、無(wú)人駕駛汽車(chē)等領(lǐng)域中都能見(jiàn)到強(qiáng)化學(xué)習(xí)的身影。

強(qiáng)化學(xué)習(xí)的任務(wù)是根據(jù)對(duì)環(huán)境的探索，制定應(yīng)對(duì)環(huán)境變化的策略。它模擬了生物探索環(huán)境和積累經(jīng)驗(yàn)的過(guò)程。例如，訓(xùn)練海豚雜技表演時(shí)，海豚每成功完成動(dòng)作，即可獲得獎(jiǎng)勵(lì)，否則沒(méi)有。這樣的經(jīng)驗(yàn)與記憶引起海豚做出精彩的雜技表演。

強(qiáng)化學(xué)習(xí)是介于監(jiān)督式學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)之間的一類(lèi)機(jī)器學(xué)習(xí)算法。一方面，強(qiáng)化學(xué)習(xí)沒(méi)有一組帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)作為其輸入，算法需要自發(fā)地探索環(huán)境來(lái)獲得訓(xùn)練數(shù)據(jù)；而另一方面，由于環(huán)境對(duì)每個(gè)行動(dòng)能給與反饋，所以可認(rèn)為，通過(guò)探索得到的數(shù)據(jù)是有標(biāo)簽的。

1.3 機(jī)器學(xué)習(xí)算法綜覽

本書(shū)的2-9章介紹監(jiān)督式學(xué)習(xí)算法。

第二章介紹監(jiān)督學(xué)習(xí)的基本概念、一般性算法架構(gòu)——經(jīng)驗(yàn)損失最小化、正則化算法。過(guò)擬合是經(jīng)驗(yàn)損失最小化算法常遇到的問(wèn)題，正則化則是降低過(guò)擬合概率的重要手段之一。

第三章講述線性回歸算法。線性回歸算法的正規(guī)方程用到了均方誤差求解最優(yōu)解的數(shù)學(xué)表達(dá)式，但絕大多數(shù)監(jiān)督式學(xué)習(xí)算法的最優(yōu)解不存在明確數(shù)學(xué)解析表達(dá)式，因此需要用更具一般性的算法來(lái)求解——搜索算法。

第四章將系統(tǒng)講解機(jī)器學(xué)習(xí)中的搜索算法，包括梯度下降算法、隨機(jī)梯度下降算法、牛頓迭代算法以及坐標(biāo)下降算法。

第五章講解Logistic回歸算法。Logistic回歸算法將回歸算法的輸出左右sigmoid函數(shù)的輸入，這樣將輸出值限制在0-1之間。

第六章介紹另一種分類(lèi)算法——支持向量機(jī)。以二元分類(lèi)為例，通過(guò)訓(xùn)練，支持向量機(jī)將計(jì)算出一條直線方程，使得帶+1和-1標(biāo)簽的訓(xùn)練數(shù)據(jù)分別位于該直線的兩側(cè)。支持向量機(jī)的中心思想是選擇一條最”中立“的直線方程，使得直線到最近的兩類(lèi)標(biāo)簽的數(shù)據(jù)點(diǎn)的距離相等。那些到這條直線距離最近的點(diǎn)被稱(chēng)為支持向量。倘若訓(xùn)練數(shù)據(jù)間不存在明確的直線邊界，也不意味著該方法失效了，有一種名為”核方法“的算法技巧，使得支持向量機(jī)算法可以處理不規(guī)則的邊界計(jì)算問(wèn)題。以上三類(lèi)算法（線性回歸、logistic回歸、支持向量機(jī)）都要求訓(xùn)練數(shù)據(jù)的特征組取值為數(shù)值，而面對(duì)特征組取值是類(lèi)別時(shí)，以上三類(lèi)無(wú)法直接使用類(lèi)別特征。

第七章介紹的決策樹(shù)算法時(shí)處理類(lèi)別特征的最佳選擇。決策樹(shù)算法既能處理分類(lèi)問(wèn)題，也能處理回歸問(wèn)題，具體算法性能比較詳見(jiàn)第七章。

第八章介紹深度學(xué)習(xí)算法的基礎(chǔ)——神經(jīng)網(wǎng)絡(luò)。

第九章介紹深度學(xué)習(xí)，包含卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)，CNN模擬人類(lèi)視覺(jué)，適合圖片識(shí)別的相關(guān)任務(wù)，RNN模擬人腦記憶，適合于時(shí)間序列和自然語(yǔ)言的相關(guān)任務(wù)。

第10-11章關(guān)于無(wú)監(jiān)督學(xué)習(xí)

第十章講解降維算法。代表性算法為主成分分析法（PCA)，還有線性判別分析法、局部線性嵌入法和多維縮放算法等

第十一章介紹聚類(lèi)算法。包含k均值算法、合并聚類(lèi)與DBSCAN算法。

第12章關(guān)于強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)的任務(wù)形式分兩類(lèi)——有模型強(qiáng)化學(xué)習(xí)和免模型強(qiáng)化學(xué)習(xí)。

對(duì)于有模型強(qiáng)化學(xué)習(xí)，任務(wù)中，行動(dòng)對(duì)環(huán)境的改變效果以及可能獲得的獎(jiǎng)懲是已知的。在這一假定下，算法可以在所有行動(dòng)開(kāi)始前用動(dòng)態(tài)規(guī)劃算法（值迭代與策略迭代）預(yù)先計(jì)算出最優(yōu)策略。

對(duì)于免模型強(qiáng)化學(xué)習(xí)，任務(wù)中，行動(dòng)對(duì)環(huán)境的改變效果以及可能獲得的獎(jiǎng)懲是未知的。算法必須自行探索來(lái)獲得環(huán)境的信息以及行動(dòng)的獎(jiǎng)懲值。第十二章將介紹兩類(lèi)免模型強(qiáng)化學(xué)習(xí)算法——時(shí)序差分模型算法和策略梯度型算法。時(shí)序差分模型算法是通過(guò)對(duì)行動(dòng)可能獲得的獎(jiǎng)懲建模來(lái)學(xué)習(xí)最優(yōu)策略，代表型算法有sarsa算法、Q學(xué)習(xí)算法和深度Q神經(jīng)網(wǎng)絡(luò)。深度Q神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的產(chǎn)物。策略梯度算法是直接對(duì)策略建模，代表型算法有REINFORCE模型和Actor-Critic算法。

總結(jié)

以上是生活随笔為你收集整理的机器学习算法概述——摘录《机器学习算法导论》的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：傅里叶展开锯齿波形图
下一篇： 2012年3月份第1周51Aspx源码发

编程问答

机器学习算法概述——摘录《机器学习算法导论》

第一章 機(jī)器學(xué)習(xí)算法概述

1.1什么是機(jī)器學(xué)習(xí)？

1.2機(jī)器學(xué)習(xí)的形式分類(lèi)

1.2.1 監(jiān)督式學(xué)習(xí)

1.2.2 無(wú)監(jiān)督學(xué)習(xí)

1.2.3強(qiáng)化學(xué)習(xí)

1.3 機(jī)器學(xué)習(xí)算法綜覽

總結(jié)

第一章機(jī)器學(xué)習(xí)算法概述