机器学习笔记(1):Introduction
目錄
1)welcome
2)What is Machine Learning
3)Supervised Learning?
4)Unsupervised Learning
1)welcome
第一個視頻主要介紹了機(jī)器學(xué)習(xí)目前的案例,主要有:數(shù)據(jù)庫挖掘、醫(yī)療記錄、生物工程、無人直升機(jī)、手寫識別、NLP、計(jì)算機(jī)視覺等。
2)What is Machine Learning
下面是機(jī)器學(xué)習(xí)的兩個定義,分別來自于Arthur Samuel 和 Tom Mitchell:
第一個定義是:在未進(jìn)行特定編程的情況下,給予計(jì)算機(jī)學(xué)習(xí)能力的領(lǐng)域。
第二個定義是:一個程序被認(rèn)為能從經(jīng)驗(yàn) E 中學(xué)習(xí),解決任務(wù) T,達(dá)到性能度量值P,當(dāng)且僅當(dāng),有了經(jīng)驗(yàn) E 后,經(jīng)過 P 評判,程序在處理 T 時的性能有所提升。
目前存在幾種不同類型的學(xué)習(xí)算法,主要的兩種類型為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。此外還有強(qiáng)化學(xué)習(xí)和推薦系統(tǒng)等。但更重要的還有了解應(yīng)用學(xué)習(xí)算法的建議。我們不僅要知道工具,更要知道如何使用好工具。
3)Supervised Learning?
先看一個例子,這有一張數(shù)據(jù)圖,橫軸表示面積,縱軸表示房價(jià)?;谶@組數(shù)據(jù),假如你有一個朋友,他有一套750平方英尺的房子,能賣多少錢?從圖中可以看出,紅色和藍(lán)色曲線代表兩種擬合方式,顯然藍(lán)色曲線擬合的效果更好。這是一個回歸問題,回歸的意思是,我們在試著推測出一個連續(xù)值的結(jié)果。
這里有一份關(guān)于乳腺癌的數(shù)據(jù),橫軸表示腫瘤大小,縱軸表示腫瘤是否為惡性。惡性則為1,良性記為0。這是一個分類的問題,分類指的是,我們推測出離散的輸出值。
在其它機(jī)器學(xué)習(xí)問題中,可能會遇到不止一種特征,我們不僅知道腫瘤的尺寸,還知道患者的年齡。腫塊密度、腫瘤細(xì)胞尺寸等等。
現(xiàn)在我們來總結(jié)一下,監(jiān)督學(xué)習(xí)基本思想是:我們數(shù)據(jù)集中的每個樣本都有相應(yīng)的 “正確答案”?;貧w可以推出一個連續(xù)的輸出,分類目標(biāo)是一組離散的結(jié)果。
4)Unsupervised Learning
現(xiàn)在我們來介紹無監(jiān)督學(xué)習(xí)。在監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集已經(jīng)有了正確的標(biāo)記。而在無監(jiān)督學(xué)習(xí)中,數(shù)據(jù)集沒有任何的標(biāo)簽。下圖中,我們把數(shù)據(jù)分成了兩個簇,這是聚類算法。
? ? ? ? ? ? ? ? ? ? ??? ? ? ? ?
下圖也是一個聚類算法的應(yīng)用,輸入一組不同個體的基因,我們把個體聚類到不同的類或不同類型的組。
下面是無監(jiān)督學(xué)習(xí)的應(yīng)用,如組織大型計(jì)算機(jī)群、社交網(wǎng)絡(luò)分析,市場分割,天文學(xué)數(shù)據(jù)分析。
總結(jié)
以上是生活随笔為你收集整理的机器学习笔记(1):Introduction的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JAMMER2ND.EXE是什么进程 J
- 下一篇: 教训惨痛!B站用户4000元买RTX 3