1.11 超过人的表现-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授
| 1.10 理解人的表現(xiàn) | 回到目錄 | 1.12 改善你的模型的表現(xiàn) |
超過(guò)人的表現(xiàn) (Surpassing Human-level Performance)
很多團(tuán)隊(duì)會(huì)因?yàn)闄C(jī)器在特定的識(shí)別分類任務(wù)中超越了人類水平而激動(dòng)不已,我們談?wù)勥@些情況,看看你們自己能不能達(dá)到。
我們討論過(guò)機(jī)器學(xué)習(xí)進(jìn)展,會(huì)在接近或者超越人類水平的時(shí)候變得越來(lái)越慢。我們舉例談?wù)劄槭裁磿?huì)這樣。
假設(shè)你有一個(gè)問(wèn)題,一組人類專家充分討論辯論之后,達(dá)到0.5%的錯(cuò)誤率,單個(gè)人類專家錯(cuò)誤率是1%,然后你訓(xùn)練出來(lái)的算法有0.6%的訓(xùn)練錯(cuò)誤率,0.8%的開發(fā)錯(cuò)誤率。所以在這種情況下,可避免偏差是多少?這個(gè)比較容易回答,0.5%是你對(duì)貝葉斯錯(cuò)誤率的估計(jì),所以可避免偏差就是0.1%。你不會(huì)用這個(gè)1%的數(shù)字作為參考,你用的是這個(gè)差值,所以也許你對(duì)可避免偏差的估計(jì)是至少0.1%,然后方差是0.2%。和減少可避免偏差比較起來(lái),減少方差可能空間更大。
但現(xiàn)在我們來(lái)看一個(gè)比較難的例子,一個(gè)人類專家團(tuán)和單個(gè)人類專家的表現(xiàn)和以前一樣,但你的算法可以得到0.3%訓(xùn)練錯(cuò)誤率,還有0.4%開發(fā)錯(cuò)誤率。現(xiàn)在,可避免偏差是什么呢?現(xiàn)在其實(shí)很難回答,事實(shí)上你的訓(xùn)練錯(cuò)誤率是0.3%,這是否意味著你過(guò)擬合了0.2%,或者說(shuō)貝葉斯錯(cuò)誤率其實(shí)是0.1%呢?或者也許貝葉斯錯(cuò)誤率是0.2%?或者貝葉斯錯(cuò)誤率是0.3%呢?你真的不知道。但是基于本例中給出的信息,你實(shí)際上沒有足夠的信息來(lái)判斷優(yōu)化你的算法時(shí)應(yīng)該專注減少偏差還是減少方差,這樣你取得進(jìn)展的效率就會(huì)降低。還有比如說(shuō),如果你的錯(cuò)誤率已經(jīng)比一群充分討論辯論后的人類專家更低,那么依靠人類直覺去判斷你的算法還能往什么方向優(yōu)化就很難了。所以在這個(gè)例子中,一旦你超過(guò)這個(gè)0.5%的門檻,要進(jìn)一步優(yōu)化你的機(jī)器學(xué)習(xí)問(wèn)題就沒有明確的選項(xiàng)和前進(jìn)的方向了。這并不意味著你不能取得進(jìn)展,你仍然可以取得重大進(jìn)展。但現(xiàn)有的一些工具幫助你指明方向的工具就沒那么好用了。
現(xiàn)在,機(jī)器學(xué)習(xí)有很多問(wèn)題已經(jīng)可以大大超越人類水平了。例如,我想網(wǎng)絡(luò)廣告,估計(jì)某個(gè)用戶點(diǎn)擊廣告的可能性,可能學(xué)習(xí)算法做到的水平已經(jīng)超越任何人類了。還有提出產(chǎn)品建議,向你推薦電影或書籍之類的任務(wù)。我想今天的網(wǎng)站做到的水平已經(jīng)超越你最親近的朋友了。還有物流預(yù)測(cè),從 AAA 到 BBB 開車需要多久,或者預(yù)測(cè)快遞車從 AAA 開到 BBB 需要多少時(shí)間。或者預(yù)測(cè)某人會(huì)不會(huì)償還貸款,這樣你就能判斷是否批準(zhǔn)這人的貸款。我想這些問(wèn)題都是今天的機(jī)器學(xué)習(xí)遠(yuǎn)遠(yuǎn)超過(guò)了單個(gè)人類的表現(xiàn)。
請(qǐng)注意這四個(gè)例子,所有這四個(gè)例子都是從結(jié)構(gòu)化數(shù)據(jù)中學(xué)習(xí)得來(lái)的,這里你可能有個(gè)數(shù)據(jù)庫(kù)記錄用戶點(diǎn)擊的歷史,你的購(gòu)物歷史數(shù)據(jù)庫(kù),或者從A到B需要多長(zhǎng)時(shí)間的數(shù)據(jù)庫(kù),以前的貸款申請(qǐng)及結(jié)果的數(shù)據(jù)庫(kù),這些并不是自然感知問(wèn)題,這些不是計(jì)算機(jī)視覺問(wèn)題,或語(yǔ)音識(shí)別,或自然語(yǔ)言處理任務(wù)。人類在自然感知任務(wù)中往往表現(xiàn)非常好,所以有可能對(duì)計(jì)算機(jī)來(lái)說(shuō)在自然感知任務(wù)的表現(xiàn)要超越人類要更難一些。
最后,這些問(wèn)題中,機(jī)器學(xué)習(xí)團(tuán)隊(duì)都可以訪問(wèn)大量數(shù)據(jù),所以比如說(shuō),那四個(gè)應(yīng)用中,最好的系統(tǒng)看到的數(shù)據(jù)量可能比任何人類能看到的都多,所以這樣就相對(duì)容易得到超越人類水平的系統(tǒng)。現(xiàn)在計(jì)算機(jī)可以檢索那么多數(shù)據(jù),它可以比人類更敏銳地識(shí)別出數(shù)據(jù)中的統(tǒng)計(jì)規(guī)律。
除了這些問(wèn)題,今天已經(jīng)有語(yǔ)音識(shí)別系統(tǒng)超越人類水平了,還有一些計(jì)算機(jī)視覺任務(wù),一些圖像識(shí)別任務(wù),計(jì)算機(jī)已經(jīng)超越了人類水平。但是由于人類對(duì)這種自然感知任務(wù)非常擅長(zhǎng),我想計(jì)算機(jī)達(dá)到那種水平要難得多。還有一些醫(yī)療方面的任務(wù),比如閱讀ECG或診斷皮膚癌,或者某些特定領(lǐng)域的放射科讀圖任務(wù),這些任務(wù)計(jì)算機(jī)做得非常好了,也許超越了單個(gè)人類的水平。
在深度學(xué)習(xí)的最新進(jìn)展中,其中一個(gè)振奮人心的方面是,即使在自然感知任務(wù)中,在某些情況下,計(jì)算機(jī)已經(jīng)可以超越人類的水平了。不過(guò)現(xiàn)在肯定更加困難,因?yàn)槿祟愐话愫苌瞄L(zhǎng)這種自然感知任務(wù)。
所以要達(dá)到超越人類的表現(xiàn)往往不容易,但如果有足夠多的數(shù)據(jù),已經(jīng)有很多深度學(xué)習(xí)系統(tǒng),在單一監(jiān)督學(xué)習(xí)問(wèn)題上已經(jīng)超越了人類的水平,所以這對(duì)你在開發(fā)的應(yīng)用是有意義的。我希望有一天你也能夠搭建出超越人類水平的深度學(xué)習(xí)系統(tǒng)。
課程板書
| 1.10 理解人的表現(xiàn) | 回到目錄 | 1.12 改善你的模型的表現(xiàn) |
總結(jié)
以上是生活随笔為你收集整理的1.11 超过人的表现-深度学习第三课《结构化机器学习项目》-Stanford吴恩达教授的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 1.10 理解人的表现-深度学习第三课《
- 下一篇: 1.12 改善你的模型表现-深度学习第三