當(dāng)前位置：首頁 >

GMIS 2017大会杨强演讲：迁移学习的挑战和六大突破点

發(fā)布時(shí)間：2025/3/21 48 豆豆

生活随笔收集整理的這篇文章主要介紹了 GMIS 2017大会杨强演讲：迁移学习的挑战和六大突破点小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

GMIS 2017大會(huì)楊強(qiáng)演講：遷移學(xué)習(xí)的挑戰(zhàn)和六大突破點(diǎn)

2017-05-28 14:04:47 ????GMIS 2017??? 0?0?1

5 月 28 日，機(jī)器之心主辦的為期兩天的全球機(jī)器智能峰會(huì)（GMIS 2017）進(jìn)入第二天，全天議程中最受關(guān)注的是多位重要嘉賓出席的領(lǐng)袖峰會(huì)，包括《人工智能：一種現(xiàn)代方法》的作者 Stuart Russell、第四范式聯(lián)合創(chuàng)始人兼首席科學(xué)家楊強(qiáng)、科大訊飛執(zhí)行總裁兼消費(fèi)者事業(yè)群總裁胡郁、阿爾伯塔大學(xué)教授及計(jì)算機(jī)圍棋頂級(jí)專家Martin Müller、Element AI 聯(lián)合創(chuàng)始人 Jean-Sebastien Cournoyer 等。

上午，第四范式首席科學(xué)家、香港科大計(jì)算機(jī)科學(xué)與工程系主任楊強(qiáng)發(fā)表了主題為《遷移學(xué)習(xí)最新進(jìn)展》的演講，他探討分享了機(jī)器學(xué)習(xí)，人工智能到底有哪些最新的進(jìn)展，以下是該演講的主要內(nèi)容：

首先，楊強(qiáng)教授回顧而今日的圍棋大戰(zhàn)，而給楊強(qiáng)教授比較深印象是柯潔所說的：「AlphaGo 看上去像神一樣的存在，好像是無懈可擊。」而我們?nèi)绻麖臋C(jī)器學(xué)習(xí)的角度來看，其還是有弱點(diǎn)的，而且這個(gè)弱點(diǎn)還很嚴(yán)重。這個(gè)弱點(diǎn)即，AlphaGo 沒有遷移學(xué)習(xí)的能力。

機(jī)器的一個(gè)能力是能使用大量數(shù)據(jù)進(jìn)行學(xué)習(xí)，所以數(shù)據(jù)的質(zhì)量是非常重要的。但是，AlphaGo 不能在學(xué)會(huì)圍棋后，遷移到擁有下象棋的能力。因此，機(jī)器如今是沒有這種推廣能力的，這就是我們今天要探討的問題——遷移學(xué)習(xí)。

但是在說這個(gè)題目之前，我們先看看能從 AlphaGo 2.0 里學(xué)到的知識(shí)：

今年的數(shù)據(jù)和去年的數(shù)據(jù)大有不同，數(shù)據(jù)的質(zhì)量使得AlphaGo的性能得到大幅度提升，所以數(shù)據(jù)的質(zhì)量是非常重要的。
計(jì)算架構(gòu)也很重要，去年 AlphaGo 用了上千塊 CPU和成百塊GPU，但今年只用了很少量的TPU。因此，今年的計(jì)算架構(gòu)有了一種飛躍性的變化。
算法也是非常重要的，強(qiáng)化學(xué)習(xí)即讓計(jì)算機(jī)自我訓(xùn)練、自我學(xué)習(xí)。如果我們賦予機(jī)器能夠自我學(xué)習(xí)的能力，它在某些方面將擁有超越人的能力，這種自我學(xué)習(xí)的算法極其重要。

這三點(diǎn)對(duì)于商業(yè)活動(dòng)其實(shí)也是非常重要的，我們可以了解到現(xiàn)有成功的人工智能應(yīng)用，都有高質(zhì)量的數(shù)據(jù)、優(yōu)良計(jì)算架構(gòu)和自我學(xué)習(xí)的閉環(huán)的能力。

人類在學(xué)會(huì)自行車后，再學(xué)摩托車就非常容易了；看了一兩張圖片，就可以把它擴(kuò)展到許多其他不同的景象。我們能把我們過去的經(jīng)驗(yàn)帶到不同的場(chǎng)景，這樣就有了一種能夠適應(yīng)新環(huán)境的能力。

機(jī)器如何才能也具有這種能力呢？楊強(qiáng)教授表示人類有一個(gè)訣竅，而這個(gè)訣竅可以應(yīng)用到機(jī)器學(xué)習(xí)中——即遷移學(xué)習(xí)的要素——就是發(fā)現(xiàn)共性，發(fā)現(xiàn)領(lǐng)域之間的共性。如果一旦發(fā)現(xiàn)了這種關(guān)鍵的共性（共同特征）遷移學(xué)習(xí)就變得非常容易。

為什么我們需要研究遷移學(xué)習(xí)？

首先，生活上我們遇到更多的是小數(shù)據(jù)，而在小數(shù)據(jù)上學(xué)習(xí)的模型，才是真正的智能。
第二，我們希望構(gòu)建的系統(tǒng)不僅在那個(gè)領(lǐng)域能夠發(fā)揮作用，在其周邊也可以發(fā)揮作用。即我們希望系統(tǒng)是可靠的，其可以舉一反三和融會(huì)貫通，這也是我們賦予智慧的一種定義。
第三，我們希望更重要的是如何能夠把一個(gè)通用的系統(tǒng)加上個(gè)人的小數(shù)據(jù)，而遷移到個(gè)人的場(chǎng)景當(dāng)中去，因此我們可以向個(gè)性化方向發(fā)展。遷移學(xué)習(xí)就是一個(gè)必不可少的工具。

但遷移學(xué)習(xí)為什么如此難以實(shí)現(xiàn)？因?yàn)榧词故侨祟愐埠茈y發(fā)現(xiàn)這些共同點(diǎn)。

遷移學(xué)習(xí)的進(jìn)展

楊強(qiáng)教授下面接著給大家介紹了一下，遷移學(xué)習(xí)最近有哪些進(jìn)展。

第一個(gè)進(jìn)展，即如果我們面臨一個(gè)機(jī)器學(xué)習(xí)問題，那么可以通過把問題的結(jié)構(gòu)和內(nèi)容分離開來而發(fā)現(xiàn)不同問題之間的共性。雖然這種方式并不容易，但一旦能夠完成地話，系統(tǒng)舉一反三的能力就非常強(qiáng)了。

以上是2005年《Science》的一篇文章，有三個(gè)研究者在手寫字體識(shí)別上將結(jié)構(gòu)和手寫的方式、斜體字等各種寫法區(qū)分開。他們發(fā)現(xiàn)，在學(xué)習(xí)結(jié)構(gòu)這一方面，用一個(gè)例子就可以實(shí)現(xiàn)，這也稱之為單個(gè)例學(xué)習(xí)。

第二個(gè)進(jìn)展，是因?yàn)檫^去我們?cè)趯W(xué)習(xí)方面太注重發(fā)現(xiàn)共性本身，但是卻沒有注意在不同的層次之間發(fā)現(xiàn)這些共性。因此，如果我們把問題分解為不同層次，那么層次化的系統(tǒng)就更容易幫助我們構(gòu)建機(jī)器學(xué)習(xí)的遷移。

在圖像識(shí)別上，如果我們把分類改變，那么傳統(tǒng)的機(jī)器學(xué)習(xí)就需要用大量數(shù)據(jù)重新訓(xùn)練，花大量時(shí)間訓(xùn)練一個(gè)新的模型。但是現(xiàn)在利用這種層次型的遷移學(xué)習(xí)，我們會(huì)發(fā)現(xiàn)，不同的層次具有不同的遷移能力，這樣遷移能力就有了一個(gè)定量的估計(jì)。所以，當(dāng)出現(xiàn)新的問題時(shí)，我們就可以把某些層次給固定住，而將其他的區(qū)域用小數(shù)據(jù)訓(xùn)練。這樣就能夠達(dá)到遷移學(xué)習(xí)的效果。

第三個(gè)進(jìn)展，過去的遷移學(xué)習(xí)，往往是有一個(gè)領(lǐng)域已經(jīng)做好了模型，而我們的目的是要把它遷移到一個(gè)新的領(lǐng)域，從舊領(lǐng)域遷移到新領(lǐng)域，從一個(gè)多數(shù)據(jù)的領(lǐng)域遷移到少數(shù)據(jù)的領(lǐng)域，這種叫單步的遷移。但是我們現(xiàn)在發(fā)現(xiàn)，很多場(chǎng)景是需要我們分階段來的。比如說我們分四年去上大學(xué)，因?yàn)槲覀冃枰盐覀兊闹R(shí)進(jìn)行分段學(xué)習(xí)，以一個(gè)課程為基礎(chǔ)轉(zhuǎn)到下一個(gè)課程。

用這個(gè)思想，我們也可以進(jìn)行多步傳導(dǎo)式的遷移，比如說我們可以建立一個(gè)機(jī)器學(xué)習(xí)的深度網(wǎng)絡(luò)，這個(gè)網(wǎng)絡(luò)的中間層即能夠照顧目標(biāo)問題領(lǐng)域，又能照顧原領(lǐng)域。

第四，學(xué)習(xí)如何遷移。這20年中，我們積累了甚至上百種遷移學(xué)習(xí)的算法，但現(xiàn)在有一個(gè)問題，即當(dāng)遇到一個(gè)新的機(jī)器學(xué)習(xí)問題時(shí)，我們不知道到底該用哪個(gè)算法。其實(shí)，既然有了這么多的算法，有了這么多的文章，我們可以把他們這些經(jīng)驗(yàn)總結(jié)起來，用來訓(xùn)練一個(gè)新的算法，這個(gè)算法它的老師就是所有這些機(jī)器學(xué)習(xí)算法和數(shù)據(jù)。所以，這種學(xué)習(xí)如何遷移，就像我們常說的學(xué)習(xí)如何學(xué)習(xí)，這個(gè)才是學(xué)習(xí)的最高境界，就是學(xué)習(xí)方法的獲取。

第五個(gè)進(jìn)展，即把遷移學(xué)習(xí)本身作為一個(gè)元學(xué)習(xí)（Meta Learning），然后再賦予到不同學(xué)習(xí)的方式上。也就是在當(dāng)前機(jī)器學(xué)習(xí)的問題或者是模型上面加一個(gè)遷移學(xué)習(xí)的模式，而變成一個(gè)遷移學(xué)習(xí)的模型。這種加一個(gè)模式的辦法就是元學(xué)習(xí)。假設(shè)我們有一個(gè)強(qiáng)化學(xué)習(xí)模型，我們?cè)谏厦孀鲆粋€(gè)“外套”，就能把它成功變成一個(gè)遷移學(xué)習(xí)模型。

最后一個(gè)的進(jìn)展，就是用數(shù)據(jù)生成式的遷移學(xué)習(xí)-GAN

我們可以通過簡(jiǎn)單的類比來理解生成對(duì)抗網(wǎng)絡(luò)：即兩個(gè)人比賽，看是 A 的矛厲害，還是 B 的盾厲害。比如，我們有一些真實(shí)數(shù)據(jù)，同時(shí)也有一把亂七八糟的假數(shù)據(jù)。A 拼命地把隨手拿過來的假數(shù)據(jù)模仿成真實(shí)數(shù)據(jù)，并揉進(jìn)真實(shí)數(shù)據(jù)里。B 則拼命地想把真實(shí)數(shù)據(jù)和假數(shù)據(jù)區(qū)分開。
這里，A 就是一個(gè)生成模型，類似于賣假貨的，一個(gè)勁兒地學(xué)習(xí)如何騙過 B。而 B 則是一個(gè)判別模型，類似于警察，一個(gè)勁兒地學(xué)習(xí)如何分辨出 A 的騙人技巧。如此這般，隨著 B 的鑒別技巧的越來高超，A 的騙人技巧也就越來越純熟。一個(gè)造假一流的 A，就是我們想要的生成模型。

最后楊強(qiáng)教授說，我們?cè)谏疃葘W(xué)習(xí)上已經(jīng)有了很大的成就，而我們今天在努力進(jìn)行各種嘗試，在強(qiáng)化學(xué)習(xí)，比如說AlphaGo，但是楊強(qiáng)教授認(rèn)為機(jī)器學(xué)習(xí)的明天是在小數(shù)據(jù)、個(gè)性化、可靠性上面，就是遷移學(xué)習(xí)的發(fā)展。

總結(jié)

以上是生活随笔為你收集整理的GMIS 2017大会杨强演讲：迁移学习的挑战和六大突破点的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： GMIS 2017 Martin Mül
下一篇： GMIS 2017 大会陈雨强演讲：机器