GMIS 2017 大会余凯演讲:深度学习引领驾驶革命
GMIS 2017 大會余凱演講:深度學(xué)習(xí)引領(lǐng)駕駛革命
2017-05-27 16:32:37 ???深度學(xué)習(xí)???創(chuàng)業(yè)公司???人工智能應(yīng)用???自動駕駛??? 0?0?0全球機(jī)器智能峰會(GMIS 2017),是全球人工智能產(chǎn)業(yè)信息服務(wù)平臺機(jī)器之心舉辦的首屆大會,邀請了來自美國、歐洲、加拿大及國內(nèi)的眾多頂級專家參會演講。本次大會共計(jì) 47 位嘉賓、5 個 Session、32 場演講、4 場圓桌論壇、1 場人機(jī)大戰(zhàn),兼顧學(xué)界與產(chǎn)業(yè)、科技巨頭與創(chuàng)業(yè)公司,以專業(yè)化、全球化的視角為人工智能從業(yè)者和愛好者奉上一場機(jī)器智能盛宴。
5 月 27 日,機(jī)器之心主辦的為期兩天的全球機(jī)器智能峰會(GMIS 2017)在北京 898 創(chuàng)新空間順利開幕。中國科學(xué)院自動化研究所復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室主任王飛躍為本次大會做了開幕式致辭,他表示:「我個人的看法是再過幾年,我們 90% 的工作是人工智能提供的,就像我們今天大部分工作是機(jī)器提供的一樣。我們知道人工智能會給我們提供一個更美好的未來。」大會第一天重要嘉賓「LSTM 之父」Jürgen Schmidhuber、Citadel 首席人工智能官鄧力、騰訊 AI Lab 副主任俞棟、英特爾 AIPG 數(shù)據(jù)科學(xué)部主任 Yinyin Liu、GE Transportation Digital Solutions CTO Wesly Mukai 等知名人工智能專家參與峰會,并在主題演講、圓桌論壇等互動形式下,從科學(xué)家、企業(yè)家、技術(shù)專家的視角,解讀人工智能的未來發(fā)展。
下午,地平線機(jī)器人創(chuàng)始人余凱發(fā)表了主題為《深度學(xué)習(xí)引領(lǐng)駕駛革命》的演講,他探討分享了如何在自動駕駛中構(gòu)建深度學(xué)習(xí)。以下是該演講的主要內(nèi)容:
每個人都在談深度學(xué)習(xí),深度學(xué)習(xí)改變了語音識別、圖像識別、自然語言、搜索,當(dāng)然還有下圍棋。那么,深度學(xué)習(xí)會引起下一個革命,并且對人類生活影響最深遠(yuǎn)的是什么?我個人的答案是自動駕駛。
2025 年,每年將有五千萬輛新車銷售,這是很大的市場。去年,美國銷售了 1700 萬輛汽車,中國銷售了 2800 萬輛,成為世界第一大汽車市場。但中國面臨著很多挑戰(zhàn),一是堵車,二是中國的司機(jī)欠缺規(guī)則意識。三是中國交通事故造成的死亡率排名世界第一。
我們能否用技術(shù)使交通出行更加便捷,人們的生活更加安全?深度學(xué)習(xí)是否可以發(fā)揮作用?
過去,我在圖像、語音,包括自然語言、互聯(lián)網(wǎng)搜索,做了很多項(xiàng)目,深度學(xué)習(xí)對整個 AI 的改變,我深有體會。
我們看到深度學(xué)習(xí)在很多領(lǐng)域,有巨大的進(jìn)展。舉兩個例子,其一,我過去曾負(fù)責(zé)一個搜索項(xiàng)目,當(dāng)時我所在的百度希望用深度學(xué)習(xí)提升搜索的相關(guān)性,但是用深度學(xué)習(xí)訓(xùn)練,需要大量數(shù)據(jù)。如果用人工標(biāo)注這樣的數(shù)據(jù),花費(fèi)時間大,各方面的成本都很高。我們想到,或許我們可以使用互聯(lián)網(wǎng)數(shù)據(jù)。比如,我們觀測到用戶點(diǎn)擊了這個網(wǎng)頁,卻沒有點(diǎn)擊另外一個網(wǎng)頁,這說明用戶隱含做了一個投票,投票不是跟點(diǎn)擊的網(wǎng)頁相關(guān),而是點(diǎn)擊的網(wǎng)頁與沒有點(diǎn)擊的網(wǎng)頁更相關(guān)。這樣一個三元組,不需要人工標(biāo)注,收集起來很容易,幾乎是無限制的訓(xùn)練樣本,可以訓(xùn)練大規(guī)模的神經(jīng)網(wǎng)絡(luò)。實(shí)際上,我們正是這樣做的,用一千個樣本訓(xùn)練有一億個參數(shù)的模型,提升搜索引擎排序相關(guān)性。Google 做的一個項(xiàng)目,也有相似的想法和模型。
另外一個例子,AlphaGo2.0 給我們帶來一個啟示,那就是,你不僅可以從過去人類棋手的歷史數(shù)據(jù)中學(xué)習(xí),還可以產(chǎn)生虛擬數(shù)據(jù)去學(xué)習(xí),這種方法也不需要人工標(biāo)注的數(shù)據(jù)。
這兩個例子表明,我們可能要拋棄過去訓(xùn)練系統(tǒng)的模式,構(gòu)建一個學(xué)習(xí)系統(tǒng),使系統(tǒng)自己學(xué)習(xí),隨著不斷地嘗試,它能不斷演進(jìn)。
從自動駕駛的角度來講,從司機(jī)、使用者的自然行為去學(xué)習(xí),或者構(gòu)建一個仿真系統(tǒng),在封閉環(huán)境中,讓汽車充分暴露控制算法里各種邊界的問題,然后去自我提升。實(shí)際上,這兩種方法都有非常顯著的優(yōu)越性,因?yàn)橐惠v車每天搜集的數(shù)據(jù),規(guī)模大到你無法想象,如果用人工去標(biāo)注,是不可能實(shí)現(xiàn)的。
但是,構(gòu)建深度學(xué)習(xí)系統(tǒng),是系統(tǒng)性的工程,軟件算法、系統(tǒng)軟件,計(jì)算架構(gòu)、處理器,云端大數(shù)據(jù)的訓(xùn)練,仿真系統(tǒng),都需要重新構(gòu)建。
首先,在軟件算法方面,我們關(guān)注三方面。
一,Transparency,可解釋性。在駕駛領(lǐng)域,黑匣子是不可接受的,如果有什么異常的行為發(fā)生,一定要知道原因,因而它必須是可以解釋的。
二,端到端的學(xué)習(xí),讓這個系統(tǒng)能自我演進(jìn),而不是被人工標(biāo)注訓(xùn)練。
三,讓軟件跟硬件適配,優(yōu)化計(jì)算性能,使其低功耗。未來大量的車將會使用電池,如果功耗很高,發(fā)熱將是問題。
90 年代,在機(jī)器學(xué)習(xí)領(lǐng)域,有一個比深度學(xué)習(xí)更加主流的框架——Bayes Networks,在不確定條件下,使智能系統(tǒng)去推理、學(xué)習(xí)。如果我們把深度神經(jīng)網(wǎng)絡(luò)與 Bayes Networks 結(jié)合,就有可能構(gòu)建一個子模塊由深度神經(jīng)網(wǎng)絡(luò)組成的可解釋的大系統(tǒng)。
這是我們公司構(gòu)建的雨果自動駕駛的軟件系統(tǒng),實(shí)際上,它是一個巨大的網(wǎng)絡(luò),由轉(zhuǎn)接神經(jīng)網(wǎng)絡(luò)及其他形式的神經(jīng)網(wǎng)絡(luò)構(gòu)建。這既可以使每個子模塊用傳統(tǒng)方法來學(xué)習(xí),也可以使整個系統(tǒng)進(jìn)行端到端學(xué)習(xí)。而這個系統(tǒng)每個模塊的接口都清晰可定義,有清晰的語義,因此,可以添加政府的規(guī)章制度以及新的法律法規(guī),形成一個 Learning Cars,使它從真實(shí)的數(shù)據(jù)中學(xué)習(xí)。除此之外,它能使軟件系統(tǒng)充分調(diào)用硬件資源,能解決 GPU 功耗太高、延遲較多的問題。
另外,整個駕駛到感知、決策,中間所有的步驟都有不同的計(jì)算模式,因而需要構(gòu)造不同的硬件去優(yōu)化這種計(jì)算。因此我們公司從成立開始,就決心做自己的硬件,使硬件適應(yīng)算法專家構(gòu)想的新算法。
舉個例子,某個 GPU 的訓(xùn)練,計(jì)算力是最強(qiáng)大的,但它計(jì)算的效率,每瓦的功耗所完成的計(jì)算,卻是不高的。我們構(gòu)造的處理器架構(gòu),計(jì)算效率逼近物理極限。
對我們的處理器,我們構(gòu)建了超過上百類的實(shí)時識別,從整個場景中抽取對自動駕駛來說非常重要的方面,比如我們不關(guān)心這輛公共汽車的窗戶數(shù)量,但我們關(guān)心它在哪個位置,朝向哪個方向,因?yàn)檫@關(guān)乎它下個 5 秒向哪個方向行駛。而這是目前的 GPU 做不到的。
不過,我們當(dāng)前的這代處理器架構(gòu)主要是為感知設(shè)計(jì)的,未來處理器的架構(gòu),更多地要為決策設(shè)計(jì),這將比今天 AlphaGo 所面對的決策問題更加復(fù)雜,因?yàn)樽詣玉{駛是一個龐大的系統(tǒng)。
另外,一輛自動駕駛的汽車,每天在路上收集的數(shù)據(jù)就有 6Million。一千輛自動駕駛汽車收集的數(shù)據(jù),比百度圖像搜索引擎所見所得的總和還要多。但是,不只是要在現(xiàn)實(shí)世界駕駛,還要通過數(shù)百億仿真系統(tǒng)在虛擬場景駕駛,這對云端計(jì)算的要求非常高,我們也面臨這樣的挑戰(zhàn)。
最后,我總結(jié)一下今天的核心內(nèi)容:
一,未來的自動駕駛一定會像其他產(chǎn)業(yè),構(gòu)建一輛自主學(xué)習(xí)的汽車,而不是被人工標(biāo)注數(shù)據(jù)訓(xùn)練的汽車。二,我們需要努力設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),使它透明,可理解,可以被控制。三,軟件重要,硬件同樣重要,我們要聯(lián)合軟件和硬件,最大化整個計(jì)算的效率、安全性和系統(tǒng)的可靠性。
總結(jié)
以上是生活随笔為你收集整理的GMIS 2017 大会余凯演讲:深度学习引领驾驶革命的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GMIS 2017 大会陈雨强演讲:机器
- 下一篇: 斯坦福CS231n 2017最新课程:李