日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

GMIS 2017大会杨强演讲:迁移学习的挑战和六大突破点

發(fā)布時(shí)間:2025/3/21 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 GMIS 2017大会杨强演讲:迁移学习的挑战和六大突破点 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

GMIS 2017大會(huì)楊強(qiáng)演講:遷移學(xué)習(xí)的挑戰(zhàn)和六大突破點(diǎn)

2017-05-28 14:04:47 ?????? 0?0?1

5 月 28 日,機(jī)器之心主辦的為期兩天的全球機(jī)器智能峰會(huì)(GMIS 2017)進(jìn)入第二天,全天議程中最受關(guān)注的是多位重要嘉賓出席的領(lǐng)袖峰會(huì),包括《人工智能:一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學(xué)家楊強(qiáng)、科大訊飛執(zhí)行總裁兼消費(fèi)者事業(yè)群總裁胡郁、阿爾伯塔大學(xué)教授及計(jì)算機(jī)圍棋頂級(jí)專家Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。

上午,第四范式首席科學(xué)家、香港科大計(jì)算機(jī)科學(xué)與工程系主任楊強(qiáng)發(fā)表了主題為《遷移學(xué)習(xí)最新進(jìn)展》的演講,他探討分享了機(jī)器學(xué)習(xí),人工智能到底有哪些最新的進(jìn)展,以下是該演講的主要內(nèi)容:

首先,楊強(qiáng)教授回顧而今日的圍棋大戰(zhàn),而給楊強(qiáng)教授比較深印象是柯潔所說的:「AlphaGo 看上去像神一樣的存在,好像是無懈可擊。」而我們?nèi)绻麖臋C(jī)器學(xué)習(xí)的角度來看,其還是有弱點(diǎn)的,而且這個(gè)弱點(diǎn)還很嚴(yán)重。這個(gè)弱點(diǎn)即,AlphaGo 沒有遷移學(xué)習(xí)的能力。

機(jī)器的一個(gè)能力是能使用大量數(shù)據(jù)進(jìn)行學(xué)習(xí),所以數(shù)據(jù)的質(zhì)量是非常重要的。但是,AlphaGo 不能在學(xué)會(huì)圍棋后,遷移到擁有下象棋的能力。因此,機(jī)器如今是沒有這種推廣能力的,這就是我們今天要探討的問題——遷移學(xué)習(xí)。

但是在說這個(gè)題目之前,我們先看看能從 AlphaGo 2.0 里學(xué)到的知識(shí):

  • 今年的數(shù)據(jù)和去年的數(shù)據(jù)大有不同,數(shù)據(jù)的質(zhì)量使得AlphaGo的性能得到大幅度提升,所以數(shù)據(jù)的質(zhì)量是非常重要的。

  • 計(jì)算架構(gòu)也很重要,去年 AlphaGo 用了上千塊 CPU和成百塊GPU,但今年只用了很少量的TPU。因此,今年的計(jì)算架構(gòu)有了一種飛躍性的變化。

  • 算法也是非常重要的,強(qiáng)化學(xué)習(xí)即讓計(jì)算機(jī)自我訓(xùn)練、自我學(xué)習(xí)。如果我們賦予機(jī)器能夠自我學(xué)習(xí)的能力,它在某些方面將擁有超越人的能力,這種自我學(xué)習(xí)的算法極其重要。

這三點(diǎn)對(duì)于商業(yè)活動(dòng)其實(shí)也是非常重要的,我們可以了解到現(xiàn)有成功的人工智能應(yīng)用,都有高質(zhì)量的數(shù)據(jù)、優(yōu)良計(jì)算架構(gòu)和自我學(xué)習(xí)的閉環(huán)的能力。

人類在學(xué)會(huì)自行車后,再學(xué)摩托車就非常容易了;看了一兩張圖片,就可以把它擴(kuò)展到許多其他不同的景象。我們能把我們過去的經(jīng)驗(yàn)帶到不同的場(chǎng)景,這樣就有了一種能夠適應(yīng)新環(huán)境的能力。

機(jī)器如何才能也具有這種能力呢?楊強(qiáng)教授表示人類有一個(gè)訣竅,而這個(gè)訣竅可以應(yīng)用到機(jī)器學(xué)習(xí)中——即遷移學(xué)習(xí)的要素——就是發(fā)現(xiàn)共性,發(fā)現(xiàn)領(lǐng)域之間的共性。如果一旦發(fā)現(xiàn)了這種關(guān)鍵的共性(共同特征)遷移學(xué)習(xí)就變得非常容易。

為什么我們需要研究遷移學(xué)習(xí)?

  • 首先,生活上我們遇到更多的是小數(shù)據(jù),而在小數(shù)據(jù)上學(xué)習(xí)的模型,才是真正的智能。

  • 第二,我們希望構(gòu)建的系統(tǒng)不僅在那個(gè)領(lǐng)域能夠發(fā)揮作用,在其周邊也可以發(fā)揮作用。即我們希望系統(tǒng)是可靠的,其可以舉一反三和融會(huì)貫通,這也是我們賦予智慧的一種定義。

  • 第三,我們希望更重要的是如何能夠把一個(gè)通用的系統(tǒng)加上個(gè)人的小數(shù)據(jù),而遷移到個(gè)人的場(chǎng)景當(dāng)中去,因此我們可以向個(gè)性化方向發(fā)展。遷移學(xué)習(xí)就是一個(gè)必不可少的工具。

但遷移學(xué)習(xí)為什么如此難以實(shí)現(xiàn)?因?yàn)榧词故侨祟愐埠茈y發(fā)現(xiàn)這些共同點(diǎn)。

遷移學(xué)習(xí)的進(jìn)展

楊強(qiáng)教授下面接著給大家介紹了一下,遷移學(xué)習(xí)最近有哪些進(jìn)展。

第一個(gè)進(jìn)展,即如果我們面臨一個(gè)機(jī)器學(xué)習(xí)問題,那么可以通過把問題的結(jié)構(gòu)和內(nèi)容分離開來而發(fā)現(xiàn)不同問題之間的共性。雖然這種方式并不容易,但一旦能夠完成地話,系統(tǒng)舉一反三的能力就非常強(qiáng)了。

以上是2005年《Science》的一篇文章,有三個(gè)研究者在手寫字體識(shí)別上將結(jié)構(gòu)和手寫的方式、斜體字等各種寫法區(qū)分開。他們發(fā)現(xiàn),在學(xué)習(xí)結(jié)構(gòu)這一方面,用一個(gè)例子就可以實(shí)現(xiàn),這也稱之為單個(gè)例學(xué)習(xí)。

第二個(gè)進(jìn)展,是因?yàn)檫^去我們?cè)趯W(xué)習(xí)方面太注重發(fā)現(xiàn)共性本身,但是卻沒有注意在不同的層次之間發(fā)現(xiàn)這些共性。因此,如果我們把問題分解為不同層次,那么層次化的系統(tǒng)就更容易幫助我們構(gòu)建機(jī)器學(xué)習(xí)的遷移。

在圖像識(shí)別上,如果我們把分類改變,那么傳統(tǒng)的機(jī)器學(xué)習(xí)就需要用大量數(shù)據(jù)重新訓(xùn)練,花大量時(shí)間訓(xùn)練一個(gè)新的模型。但是現(xiàn)在利用這種層次型的遷移學(xué)習(xí),我們會(huì)發(fā)現(xiàn),不同的層次具有不同的遷移能力,這樣遷移能力就有了一個(gè)定量的估計(jì)。所以,當(dāng)出現(xiàn)新的問題時(shí),我們就可以把某些層次給固定住,而將其他的區(qū)域用小數(shù)據(jù)訓(xùn)練。這樣就能夠達(dá)到遷移學(xué)習(xí)的效果。

第三個(gè)進(jìn)展,過去的遷移學(xué)習(xí),往往是有一個(gè)領(lǐng)域已經(jīng)做好了模型,而我們的目的是要把它遷移到一個(gè)新的領(lǐng)域,從舊領(lǐng)域遷移到新領(lǐng)域,從一個(gè)多數(shù)據(jù)的領(lǐng)域遷移到少數(shù)據(jù)的領(lǐng)域,這種叫單步的遷移。但是我們現(xiàn)在發(fā)現(xiàn),很多場(chǎng)景是需要我們分階段來的。比如說我們分四年去上大學(xué),因?yàn)槲覀冃枰盐覀兊闹R(shí)進(jìn)行分段學(xué)習(xí),以一個(gè)課程為基礎(chǔ)轉(zhuǎn)到下一個(gè)課程。

用這個(gè)思想,我們也可以進(jìn)行多步傳導(dǎo)式的遷移,比如說我們可以建立一個(gè)機(jī)器學(xué)習(xí)的深度網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)的中間層即能夠照顧目標(biāo)問題領(lǐng)域,又能照顧原領(lǐng)域。

第四,學(xué)習(xí)如何遷移。這20年中,我們積累了甚至上百種遷移學(xué)習(xí)的算法,但現(xiàn)在有一個(gè)問題,即當(dāng)遇到一個(gè)新的機(jī)器學(xué)習(xí)問題時(shí),我們不知道到底該用哪個(gè)算法。其實(shí),既然有了這么多的算法,有了這么多的文章,我們可以把他們這些經(jīng)驗(yàn)總結(jié)起來,用來訓(xùn)練一個(gè)新的算法,這個(gè)算法它的老師就是所有這些機(jī)器學(xué)習(xí)算法和數(shù)據(jù)。所以,這種學(xué)習(xí)如何遷移,就像我們常說的學(xué)習(xí)如何學(xué)習(xí),這個(gè)才是學(xué)習(xí)的最高境界,就是學(xué)習(xí)方法的獲取。

第五個(gè)進(jìn)展,即把遷移學(xué)習(xí)本身作為一個(gè)元學(xué)習(xí)(Meta Learning),然后再賦予到不同學(xué)習(xí)的方式上。也就是在當(dāng)前機(jī)器學(xué)習(xí)的問題或者是模型上面加一個(gè)遷移學(xué)習(xí)的模式,而變成一個(gè)遷移學(xué)習(xí)的模型。這種加一個(gè)模式的辦法就是元學(xué)習(xí)。假設(shè)我們有一個(gè)強(qiáng)化學(xué)習(xí)模型,我們?cè)谏厦孀鲆粋€(gè)“外套”,就能把它成功變成一個(gè)遷移學(xué)習(xí)模型。


最后一個(gè)的進(jìn)展,就是用數(shù)據(jù)生成式的遷移學(xué)習(xí)-GAN

我們可以通過簡(jiǎn)單的類比來理解生成對(duì)抗網(wǎng)絡(luò):即兩個(gè)人比賽,看是 A 的矛厲害,還是 B 的盾厲害。比如,我們有一些真實(shí)數(shù)據(jù),同時(shí)也有一把亂七八糟的假數(shù)據(jù)。A 拼命地把隨手拿過來的假數(shù)據(jù)模仿成真實(shí)數(shù)據(jù),并揉進(jìn)真實(shí)數(shù)據(jù)里。B 則拼命地想把真實(shí)數(shù)據(jù)和假數(shù)據(jù)區(qū)分開。
這里,A 就是一個(gè)生成模型,類似于賣假貨的,一個(gè)勁兒地學(xué)習(xí)如何騙過 B。而 B 則是一個(gè)判別模型,類似于警察,一個(gè)勁兒地學(xué)習(xí)如何分辨出 A 的騙人技巧。如此這般,隨著 B 的鑒別技巧的越來高超,A 的騙人技巧也就越來越純熟。一個(gè)造假一流的 A,就是我們想要的生成模型。

最后楊強(qiáng)教授說,我們?cè)谏疃葘W(xué)習(xí)上已經(jīng)有了很大的成就, 而我們今天在努力進(jìn)行各種嘗試,在強(qiáng)化學(xué)習(xí),比如說AlphaGo,但是楊強(qiáng)教授認(rèn)為機(jī)器學(xué)習(xí)的明天是在小數(shù)據(jù)、個(gè)性化、可靠性上面,就是遷移學(xué)習(xí)的發(fā)展。

總結(jié)

以上是生活随笔為你收集整理的GMIS 2017大会杨强演讲:迁移学习的挑战和六大突破点的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。