学习总结:机器学习(一)
有監(jiān)督學(xué)習(xí)(Supervised Learning)
所謂有監(jiān)督學(xué)習(xí),是區(qū)別于無(wú)監(jiān)督學(xué)習(xí)而言的。其過(guò)程如下:
給定一系列樣本,樣本是由一系列特征值和輸出值組成。比如,某個(gè)地方的商品房,包括房子大小、房間數(shù)、距離市中心的距離等等特征值以及房?jī)r(jià)這個(gè)輸出值。根據(jù)這些樣本,找出特征值和輸出值之間的規(guī)律,從而根據(jù)這些規(guī)律預(yù)測(cè)新的樣本?!罢乙?guī)律”就是一個(gè)學(xué)習(xí)或訓(xùn)練的過(guò)程。有監(jiān)督學(xué)習(xí)就是在學(xué)習(xí)的過(guò)程中,加入人工的干預(yù);換一種說(shuō)法,就是在訓(xùn)練的過(guò)程中,告訴機(jī)器,對(duì)每一個(gè)輸入,輸出應(yīng)該是什么。訓(xùn)練完成后,我們得到了一種規(guī)律。根據(jù)這個(gè)規(guī)律,對(duì)于以后新來(lái)的樣本,可以通過(guò)分析其特征值,預(yù)測(cè)其輸出值。比如,我們通過(guò)訓(xùn)練或?qū)W習(xí),知道了房子大小、房間數(shù)、距離市中心的距離等等特征與房?jī)r(jià)之間的關(guān)系,新來(lái)一套房子,我們就可以根據(jù)新房子的大小、房間數(shù)、距離市中心的距離等等特征,預(yù)測(cè)其價(jià)格。
對(duì)于有監(jiān)督學(xué)習(xí)來(lái)說(shuō),最核心的思想是怎么找出其中“規(guī)律”的過(guò)程。
用數(shù)學(xué)的方法來(lái)描述:我們可以將樣本的特征作為輸入,經(jīng)過(guò)其“規(guī)律”的變換,得到其輸出。特征空間用X表示,輸出空間用Y表示,而其"規(guī)律"則用h來(lái)表示,我們可以得到一個(gè)映射關(guān)系:
? ? ? ? ? ? ?
在此,我們得到了樣本特征與輸出的數(shù)學(xué)表達(dá)式,有監(jiān)督學(xué)習(xí)的過(guò)程就是確定函數(shù)h的過(guò)程。至于怎樣確定,在以后的學(xué)習(xí)中會(huì)有許許多多的方法。
然后,還有一些基本概念。用于訓(xùn)練的樣本,組成的集合,我們稱(chēng)之為訓(xùn)練集(training set)。訓(xùn)練集中樣本的特征組成的空間,我們稱(chēng)之為特征空間。如上所述的過(guò)程,可用下圖一覽概括:
對(duì)于上述例子中所述的房?jī)r(jià)問(wèn)題,其預(yù)測(cè)為一系列連續(xù)的值,我們稱(chēng)這樣的問(wèn)題為回歸問(wèn)題。而如果輸出只是若干個(gè)離散的值,我們就可以稱(chēng)之為分類(lèi)問(wèn)題。比如,某些應(yīng)用中需要判斷一幅圖像中的人的性別,輸出只有兩個(gè)值,“男”或“女”,這就是一個(gè)典型的二分類(lèi)問(wèn)題。
轉(zhuǎn)載于:https://www.cnblogs.com/guobiao819/p/supervised_learning.html
總結(jié)
以上是生活随笔為你收集整理的学习总结:机器学习(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 试管移植不着床的原因?
- 下一篇: 小试---EF5.0入门实例1