机器学习算法概述——摘录《机器学习算法导论》
目錄
第一章 機(jī)器學(xué)習(xí)算法概述
1.1什么是機(jī)器學(xué)習(xí)?
1.2機(jī)器學(xué)習(xí)的形式分類(lèi)
1.2.1 監(jiān)督式學(xué)習(xí)
1.2.2 無(wú)監(jiān)督學(xué)習(xí)
1.2.3強(qiáng)化學(xué)習(xí)
1.3 機(jī)器學(xué)習(xí)算法綜覽
第一章 機(jī)器學(xué)習(xí)算法概述
人工只能的概念是由以麥卡賽、明斯基、羅切斯特和香農(nóng)等為首的一批科學(xué)家在1956年提出的。為何已有六十余年的歷史學(xué)科又一次進(jìn)入到人們視野的中心?是什么技術(shù)的突破,為人工智能領(lǐng)域注入了新鮮的活力?
人工智能的核心是機(jī)器學(xué)習(xí),而機(jī)器學(xué)習(xí)的核心是算法!近年來(lái),機(jī)器學(xué)習(xí)的算法,尤其是深度學(xué)習(xí)算法,展現(xiàn)出了無(wú)與倫比的威力,而且GPU(圖像處理器)的高速發(fā)展,使得大規(guī)模深度學(xué)習(xí)成為可能。正是機(jī)器學(xué)習(xí)算法和硬件技術(shù)的土坯使得人工智能煥發(fā)新生。
本書(shū)將要回答:機(jī)器如何通過(guò)學(xué)習(xí)獲取智能?機(jī)器學(xué)習(xí)算法和傳統(tǒng)算法有何不同?
本章先概述機(jī)器學(xué)習(xí)這領(lǐng)域。
1.1什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)是智能體通過(guò)模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為來(lái)獲得新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu),以不斷改善自身智能。
給定任務(wù)T,相關(guān)的經(jīng)驗(yàn)E,關(guān)于學(xué)習(xí)效果的度量P,機(jī)器學(xué)習(xí)就是通過(guò)對(duì)經(jīng)驗(yàn)E的學(xué)習(xí)來(lái)優(yōu)化任務(wù)T完成效果度量P的一個(gè)過(guò)程。
舉例:無(wú)人駕駛汽車(chē)系統(tǒng)中,機(jī)器學(xué)習(xí)的任務(wù)就是根據(jù)路況確定駕駛方式;學(xué)習(xí)效果的度量可以是事故發(fā)生的概率;經(jīng)驗(yàn)是人類(lèi)大量的駕駛數(shù)據(jù)。
在機(jī)器學(xué)習(xí)中,用于學(xué)習(xí)的經(jīng)驗(yàn)數(shù)據(jù)為訓(xùn)練數(shù)據(jù),完成任務(wù)的方法叫模型。機(jī)器學(xué)習(xí)的核心是設(shè)計(jì)出以訓(xùn)練數(shù)據(jù)為輸入,模型為輸出的算法。
1.2機(jī)器學(xué)習(xí)的形式分類(lèi)
常見(jiàn)的機(jī)器學(xué)習(xí)的形式分類(lèi)有兩種:無(wú)監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)。此外,還有介入兩者之間的形式——強(qiáng)化學(xué)習(xí)。
1.2.1 監(jiān)督式學(xué)習(xí)
在這類(lèi)機(jī)器學(xué)習(xí)的學(xué)習(xí)形式中,每一條訓(xùn)練數(shù)據(jù)含有兩部分信息:特征組和標(biāo)簽。一條訓(xùn)練數(shù)據(jù)中的特征組是對(duì)應(yīng)對(duì)象的特征的描述,而標(biāo)簽則是對(duì)象的一個(gè)屬性。監(jiān)督式學(xué)習(xí)的任務(wù)就是根據(jù)對(duì)象的特征組對(duì)標(biāo)簽的取值進(jìn)行預(yù)測(cè)。
舉例:手寫(xiě)數(shù)字識(shí)別。特征組是手寫(xiě)數(shù)字圖片的像素灰度矩陣,標(biāo)簽是圖片中的數(shù)字。
通常,有兩種獲取標(biāo)簽值的方式:1.人工標(biāo)注法。例如,電影推薦系統(tǒng)中,用戶(hù)給影片的評(píng)分便是訓(xùn)練數(shù)據(jù)的標(biāo)簽。2.數(shù)據(jù)自帶標(biāo)簽值。例如,搜索引擎中,點(diǎn)擊率越高的鏈接,應(yīng)當(dāng)排在前面。
根據(jù)訓(xùn)練數(shù)據(jù)所帶標(biāo)簽值的特性,又可將監(jiān)督式學(xué)習(xí)分為兩類(lèi)——分類(lèi)問(wèn)題和回歸問(wèn)題。
分類(lèi)問(wèn)題,是指標(biāo)簽值只取有限個(gè)可能值,對(duì)應(yīng)的監(jiān)督式學(xué)習(xí)。每個(gè)標(biāo)簽值代表一個(gè)類(lèi),含有k個(gè)類(lèi)別的分類(lèi)問(wèn)題被稱(chēng)為k元分類(lèi)問(wèn)題。
分類(lèi)問(wèn)題的任務(wù)可分為兩種形式。第一種是要求對(duì)類(lèi)別有明確的預(yù)測(cè);第二種是計(jì)算出給定對(duì)象屬于每一類(lèi)別的概率。
回歸問(wèn)題,是指標(biāo)簽取值為某個(gè)區(qū)間實(shí)數(shù)的監(jiān)督學(xué)習(xí)問(wèn)題。例如,房?jī)r(jià)預(yù)測(cè)中,訓(xùn)練數(shù)據(jù)包含房屋及相關(guān)具體特征 和 交易價(jià)格(標(biāo)簽值)。
上述兩類(lèi)監(jiān)督式學(xué)習(xí)問(wèn)題可以相互轉(zhuǎn)化,比如logistic回歸就是一種利用回歸方法求解分類(lèi)問(wèn)題的算法。
1.2.2 無(wú)監(jiān)督學(xué)習(xí)
訓(xùn)練數(shù)據(jù)不含標(biāo)簽。無(wú)監(jiān)督學(xué)習(xí)問(wèn)題的任務(wù)通常是對(duì)數(shù)據(jù)本身的模式識(shí)別與分類(lèi)。廣泛應(yīng)用于降維問(wèn)題和聚類(lèi)問(wèn)題。
降維問(wèn)題。機(jī)器學(xué)習(xí)中每條訓(xùn)練數(shù)據(jù)的特征組都可以用一個(gè)向量來(lái)表示。此向量的每個(gè)分量代表了對(duì)象的一個(gè)特征。實(shí)際應(yīng)用中,特征組的維度相當(dāng)高(甚至達(dá)百萬(wàn)數(shù)量級(jí))時(shí),眾多特征增加了求解問(wèn)題的復(fù)雜性,因此對(duì)高維度的特征組進(jìn)行低維近似,是降維問(wèn)題的主要應(yīng)用。降維問(wèn)題的另一個(gè)應(yīng)用便是數(shù)據(jù)可視化。
聚類(lèi)問(wèn)題。無(wú)監(jiān)督學(xué)習(xí)的聚類(lèi)問(wèn)題和有監(jiān)督學(xué)習(xí)的分類(lèi)問(wèn)題區(qū)別在于:聚類(lèi)問(wèn)題的任務(wù)僅限于對(duì)未知分類(lèi)的一批數(shù)據(jù)進(jìn)行聚類(lèi),而分類(lèi)問(wèn)題是用已知分類(lèi)的訓(xùn)練數(shù)據(jù)訓(xùn)練出一個(gè)能夠預(yù)測(cè)數(shù)據(jù)類(lèi)別的模型。二者都是將數(shù)據(jù)按模式分類(lèi)。聚類(lèi)問(wèn)題常應(yīng)用于異常探測(cè)。聚類(lèi)算法將數(shù)據(jù)聚成兩類(lèi)——正常類(lèi)和異常類(lèi)。
1.2.3強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)是現(xiàn)代人工智能的重要課題,在博弈策略、無(wú)人駕駛汽車(chē)等領(lǐng)域中都能見(jiàn)到強(qiáng)化學(xué)習(xí)的身影。
強(qiáng)化學(xué)習(xí)的任務(wù)是根據(jù)對(duì)環(huán)境的探索,制定應(yīng)對(duì)環(huán)境變化的策略。它模擬了生物探索環(huán)境和積累經(jīng)驗(yàn)的過(guò)程。例如,訓(xùn)練海豚雜技表演時(shí),海豚每成功完成動(dòng)作,即可獲得獎(jiǎng)勵(lì),否則沒(méi)有。這樣的經(jīng)驗(yàn)與記憶引起海豚做出精彩的雜技表演。
強(qiáng)化學(xué)習(xí)是介于監(jiān)督式學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)之間的一類(lèi)機(jī)器學(xué)習(xí)算法。一方面,強(qiáng)化學(xué)習(xí)沒(méi)有一組帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)作為其輸入,算法需要自發(fā)地探索環(huán)境來(lái)獲得訓(xùn)練數(shù)據(jù);而另一方面,由于環(huán)境對(duì)每個(gè)行動(dòng)能給與反饋,所以可認(rèn)為,通過(guò)探索得到的數(shù)據(jù)是有標(biāo)簽的。
1.3 機(jī)器學(xué)習(xí)算法綜覽
本書(shū)的2-9章介紹監(jiān)督式學(xué)習(xí)算法。
第二章介紹監(jiān)督學(xué)習(xí)的基本概念、一般性算法架構(gòu)——經(jīng)驗(yàn)損失最小化、正則化算法。過(guò)擬合是經(jīng)驗(yàn)損失最小化算法常遇到的問(wèn)題,正則化則是降低過(guò)擬合概率的重要手段之一。
第三章講述線性回歸算法。線性回歸算法的正規(guī)方程用到了均方誤差求解最優(yōu)解的數(shù)學(xué)表達(dá)式,但絕大多數(shù)監(jiān)督式學(xué)習(xí)算法的最優(yōu)解不存在明確數(shù)學(xué)解析表達(dá)式,因此需要用更具一般性的算法來(lái)求解——搜索算法。
第四章將系統(tǒng)講解機(jī)器學(xué)習(xí)中的搜索算法,包括梯度下降算法、隨機(jī)梯度下降算法、牛頓迭代算法以及坐標(biāo)下降算法。
第五章講解Logistic回歸算法。Logistic回歸算法將回歸算法的輸出左右sigmoid函數(shù)的輸入,這樣將輸出值限制在0-1之間。
第六章介紹另一種分類(lèi)算法——支持向量機(jī)。以二元分類(lèi)為例,通過(guò)訓(xùn)練,支持向量機(jī)將計(jì)算出一條直線方程,使得帶+1和-1標(biāo)簽的訓(xùn)練數(shù)據(jù)分別位于該直線的兩側(cè)。支持向量機(jī)的中心思想是選擇一條最”中立“的直線方程,使得直線到最近的兩類(lèi)標(biāo)簽的數(shù)據(jù)點(diǎn)的距離相等。那些到這條直線距離最近的點(diǎn)被稱(chēng)為支持向量。倘若訓(xùn)練數(shù)據(jù)間不存在明確的直線邊界,也不意味著該方法失效了,有一種名為”核方法“的算法技巧,使得支持向量機(jī)算法可以處理不規(guī)則的邊界計(jì)算問(wèn)題。以上三類(lèi)算法(線性回歸、logistic回歸、支持向量機(jī))都要求訓(xùn)練數(shù)據(jù)的特征組取值為數(shù)值,而面對(duì)特征組取值是類(lèi)別時(shí),以上三類(lèi)無(wú)法直接使用類(lèi)別特征。
第七章介紹的決策樹(shù)算法時(shí)處理類(lèi)別特征的最佳選擇。決策樹(shù)算法既能處理分類(lèi)問(wèn)題,也能處理回歸問(wèn)題,具體算法性能比較詳見(jiàn)第七章。
第八章介紹深度學(xué)習(xí)算法的基礎(chǔ)——神經(jīng)網(wǎng)絡(luò)。
第九章介紹深度學(xué)習(xí),包含卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),CNN模擬人類(lèi)視覺(jué),適合圖片識(shí)別的相關(guān)任務(wù),RNN模擬人腦記憶,適合于時(shí)間序列和自然語(yǔ)言的相關(guān)任務(wù)。
第10-11章關(guān)于無(wú)監(jiān)督學(xué)習(xí)
第十章講解降維算法。代表性算法為主成分分析法(PCA),還有線性判別分析法、局部線性嵌入法和多維縮放算法等
第十一章介紹聚類(lèi)算法。包含k均值算法、合并聚類(lèi)與DBSCAN算法。
第12章 關(guān)于強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)的任務(wù)形式分兩類(lèi)——有模型強(qiáng)化學(xué)習(xí)和免模型強(qiáng)化學(xué)習(xí)。
對(duì)于有模型強(qiáng)化學(xué)習(xí),任務(wù)中,行動(dòng)對(duì)環(huán)境的改變效果以及可能獲得的獎(jiǎng)懲是已知的。在這一假定下,算法可以在所有行動(dòng)開(kāi)始前用動(dòng)態(tài)規(guī)劃算法(值迭代與策略迭代)預(yù)先計(jì)算出最優(yōu)策略。
對(duì)于免模型強(qiáng)化學(xué)習(xí),任務(wù)中,行動(dòng)對(duì)環(huán)境的改變效果以及可能獲得的獎(jiǎng)懲是未知的。算法必須自行探索來(lái)獲得環(huán)境的信息以及行動(dòng)的獎(jiǎng)懲值。第十二章將介紹兩類(lèi)免模型強(qiáng)化學(xué)習(xí)算法——時(shí)序差分模型算法和策略梯度型算法。時(shí)序差分模型算法是通過(guò)對(duì)行動(dòng)可能獲得的獎(jiǎng)懲建模來(lái)學(xué)習(xí)最優(yōu)策略,代表型算法有sarsa算法、Q學(xué)習(xí)算法和深度Q神經(jīng)網(wǎng)絡(luò)。深度Q神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的產(chǎn)物。策略梯度算法是直接對(duì)策略建模,代表型算法有REINFORCE模型和Actor-Critic算法。
總結(jié)
以上是生活随笔為你收集整理的机器学习算法概述——摘录《机器学习算法导论》的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 傅里叶展开锯齿波形图
- 下一篇: 2012年3月份第1周51Aspx源码发