日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

计算所山世光:AI方法论需升级,疫后 AI 将如何发展?

發(fā)布時間:2023/11/22 综合教程 39 生活家
生活随笔 收集整理的這篇文章主要介紹了 计算所山世光:AI方法论需升级,疫后 AI 将如何发展? 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

  雷鋒網(wǎng) AI 科技評論按:曾被譽為人工智能的三駕馬車——算法、算力、數(shù)據(jù),到了需要反思的時刻。特別是深度學習在學術前沿的后續(xù)發(fā)展乏力,恐難支撐 AI 能力繼續(xù)升級。

  步入新的十年后,如今 AI 可能已經(jīng)到了一個拐點時刻。

  那么接下來,AI 技術將如何發(fā)展、應用?隨著國內(nèi)疫情的結束,這逐漸成為領域內(nèi)眾多研究者和從業(yè)者亟需回答的一個關鍵問題。

  4 月 9 日,中國科協(xié)學會學術部、中國科學報聯(lián)合騰訊科協(xié)、騰訊發(fā)展研究辦公室舉辦了一場非常及時的線上論壇活動,主題為“人工智能:科技與經(jīng)濟融合新引擎”。眾多學者專家紛紛回答了疫后人工智能科技與經(jīng)濟融合發(fā)展的諸多問題。

  雷鋒網(wǎng) AI 科技評論本著對人工智能技術重點關注,選取中科院計算所研究員、中科視拓創(chuàng)始人山世光的報告內(nèi)容做以整理,分享給大家。

  山世光研究員的報告分為兩大部分,先是從研究的角度,他認為 AI 方法論將從「數(shù)據(jù)驅動」轉向「知識+數(shù)據(jù)聯(lián)合驅動」;在后一部分,他從行業(yè)發(fā)展的層面提出了五大觀點和建議。這些內(nèi)容具有深刻的洞見性。

  1、從學術前沿視角來看,深度學習已成強弩之末

  在過去十年里,人工智能的研究從過去依靠規(guī)則、知識來設計人工智能算法這樣一套方法論,逐漸過渡到了以數(shù)據(jù)為主要驅動力的方法論。

  在這個方法論的指導下,靠著“三駕馬車”——算法、大數(shù)據(jù)、強算力,支撐起了現(xiàn)在的 AI 能力。算法上主要以深度學習為主,數(shù)據(jù)則強調要足夠大(且是有監(jiān)督的標注數(shù)據(jù)),由于深度學習動輒需要通過訓練設定上億的參數(shù)也導致了非常依賴強大算力的支撐。

  于是,只要滿足下面兩個條件的 AI 任務,都能夠得到好的解決:

  1)專用 AI 任務(而非通用 AI)。例如醫(yī)療影像中,看肺炎的 AI 就只能看肺炎,不能看肝炎;看 CT 的 AI 就只能看 CT,不能看核磁。

  2)“好”數(shù)據(jù)肥沃(通過商業(yè)模式大量獲取數(shù)據(jù))。所謂好數(shù)據(jù),一方面要有較大的規(guī)模,另一方面則是要有好的標注。

  但這樣的 AI,離我們所期望的相距甚遠。

  微軟亞洲研究院院長洪小文博士曾提出如下的 AI 能力金字塔(黃色字體是山世光增加內(nèi)容):

  按照這種金字塔層次,目前的 AI 技術仍還停留在第二層的「感知和簡單推理」上面,也即相當于非人類靈長類動物的層次。

  如何更進一步,向上做到認知、情感、創(chuàng)造,甚至智慧呢?

  山世光認為我們至少需要做以下幾種能力的提升——

  然而,現(xiàn)有的 AI 方法論并不足以支撐 AI 能力繼續(xù)升級。

  首先,算法、算力、數(shù)據(jù)這三架馬車已略顯疲軟。算力提升和大數(shù)據(jù)收集都需要投入資源,但算法卻大多是一個模型對一個任務,現(xiàn)在是問題很多,方法卻有限。

  其次,深度學習在工業(yè)界還在靠大數(shù)據(jù)和大算力進行應用研究,由于沒有強大的理論支撐,有些算力和數(shù)據(jù)會浪費在試錯上,這一點現(xiàn)在已經(jīng)變得越來越明顯。

  而另一方面,在學術前沿上,深度學習顯示出的潛力有限。為什么呢?因為它本身無法克服高度數(shù)據(jù)依賴問題,無法像人一樣基于“弱”、“小”數(shù)據(jù)進行精確而且魯棒的學習!現(xiàn)有研究還都寄希望于基于深度學習來解決數(shù)據(jù)依賴的問題,希望能夠賦予機器學習從弱監(jiān)督、小數(shù)據(jù)來學習的能力,但從原理上來說,如果沒有別的數(shù)據(jù)或知識做支撐,這幾乎是不可能的。我們必須找到全新的方法。

  2、未來 10 年的 AI 方法論:知識+數(shù)據(jù)聯(lián)合驅動

  AI 能力的升級,必須依賴 AI 方法論的升級,而這歸結到本質,還是算法的革新。

  山世光研究員提出如下幾種亟需發(fā)展的 AI 算法——


舉例來說,算法能否在數(shù)據(jù)量減小到原來 10% 甚至1%,同時還保持和原來相當?shù)哪芰δ??在現(xiàn)有的算法(純數(shù)據(jù)驅動)中,是否可以加入知識,或者已有的其他數(shù)據(jù)或模型,做到知識和數(shù)據(jù)聯(lián)合驅動?……事實上,已經(jīng)有許多研究單位在做,也是當下 AI 算法上最值得探索的幾個研究方向之一。

  針對以上內(nèi)容,山世光從「數(shù)據(jù)依賴」的角度做了詳細說明。前面提到,當前人工智能的方法是強大 (強監(jiān)督、大規(guī)模) 數(shù)據(jù)依賴。但我們知道人類智能并不是如此,簡單舉幾例人類的能力:

  • 歸納和演繹推理:從個別到一般,再從一般到個別;

  • 舉一反三&觸類旁通:類似推演&遷移學習;

  • 吃一塹長一智:從少量錯誤中學習(修改模型);

  • 預測檢驗:時刻預測并修正誤差;自糾錯學習;

  • 元方法:道生一,一生二,二生三,三生萬物;

  • 融會貫通:多模態(tài)、多學科知識校驗和融合;

  • 想象力和創(chuàng)造力:無中生有,外插而非內(nèi)插。

  從這些能力中,我們可以看出,人類的智能本質上是一種知識+弱小(弱監(jiān)督、小樣本)數(shù)據(jù)驅動的方法。這種特性值得我們參考。

  山世光研究員認為,人類能夠做到小數(shù)據(jù)的學習,原因在于有知識的積累。因此如何把知識融合到機器當中,對于 AI 算法非常重要。這里的知識既可能是人類總結出的知識,也可以是已有 AI 學到的知識,他把后面這種知識稱之為“機器知識”。

  所謂“機器知識”,不同于“人類知識”,很可能不是人類可閱讀的,甚至不是人類可理解的。如山世光研究員所說,當我們已經(jīng)用算法解決了N個任務(例如識別人臉、猴臉、馬臉、狗臉、牛臉等)后,機器就有可能從這些任務中總結出一些通用任務的規(guī)則,作為“元”模型。

  有了“機器知識”,即使是小數(shù)據(jù)/無數(shù)據(jù)的任務,也能夠獲得好的性能。例如可以借助上述從人 / 猴、馬、狗、牛等學習到的臉部識別模型,得出一個關于臉的“元”模型,用來識別考拉臉、魚臉、熊貓臉等。

  (現(xiàn)在的方法則往往是,識別一個動物,就要收集大量這個動物的臉部照片,換種動物就得重新收集和學習,既不高效,也不優(yōu)雅,甚至笨拙的有點可笑。)

  事實上,這種研究本質上是多任務協(xié)同的問題,在 2018 年已經(jīng)有人在做,CVPR 2018 的最佳論文正是其中的代表,這個工作研究了 26 個不同任務之間的關系,以及如何可以互相支撐,從而減少對標注數(shù)據(jù)的需求。

  基于以上的分析,山世光研究員認為,AI 的方法論,在過去十年逐漸變?yōu)橐詮?、大?shù)據(jù)驅動為主,但接下來的十年或更長時間里,知識和數(shù)據(jù)聯(lián)合驅動將成為主流。當然這里的知識,并不僅僅指人類可以理解的知識,也可能是許多人類無法理解的“機器知識”。

  3、五大觀點&建議

  在報告的后半部分,山世光研究員針對目前我國的人工智能發(fā)展,提出了五大觀點和建議,如下:

  1)AI 應用研究方面差距不大

  中美(歐)之間在應用研究上差距不大,但我們在各行業(yè)縱深應用(即在其他研究領域)上仍需努力。例如,AI 在生物信息領域的應用,西方的積淀很多,深度學習也滲透了很多,而我國在這方面就需要努力趕超。

  2)AI 基礎研究方面差距不容小覷

  中美(歐)差距在縮小,但中國加速度不夠。過去十年最具代表性的方法主要還是來自歐美大學或企業(yè),平起平坐恐怕至少還需要5-10 年或更久。我們存在的問題在于,對基礎研究長期性的認知不足,缺乏起碼的耐心!重大基礎研究項目評估周期過短,甚至要求技術路線清晰,2 年出成果。但基礎研究往往是“無心插柳柳成蔭,有心栽花花不開”。以深度卷積神經(jīng)網(wǎng)絡(DCNN)為例,它是 1980 年代的產(chǎn)物,過了近 20 年才開始發(fā)揮出威力。

  3)AI 基礎設施方面差距不小

  這包括三個方面,分別是硬件、軟件和智件。

  國內(nèi)在基礎硬件平臺上的投入很大,但存在重復建設,尚未形成合力,不能充分發(fā)揮效力;另外由于深度學習的理論基礎較為薄弱,無效試錯導致算力浪費的現(xiàn)象也存在。

  而另一方面,在基礎軟件平臺上中國投入需要提升(相較北美至少落后4-8 年),深度學習的主流底層框架(TensorFlow,Pytorch,MxNet)主要還是由北美國家建設,10 年后,這方面可能會恰如今日之“芯片產(chǎn)業(yè)”,成為我們的“隱患”;最近中國有不少企業(yè)單位(百度,華為,曠視,清華,鵬城實驗室...)相繼發(fā)布或擬發(fā)布開源框架,希望能形成合力。山世光建議,針對低門檻的 AI 研發(fā)平臺和工具,我們需要盡快搶占先機。

  此外,山世光建議,我們在基礎智件體系投入上要加大(包括基礎算法研究),建議加強基礎智件體系研究:從過去已有的計算中心和數(shù)據(jù)中心開始,如何建設算法中心,知識中心等,建議盡快建設國家級的“知識中心”,包括人類知識中心(通用知識+領域知識)和機器知識(成熟 AI 算法和模型)中心,做到已實現(xiàn)的 AI 算法可以像水、電、煤一樣取用,從而避免大量重復勞動。

  4)AI 人才培養(yǎng)的傾斜力度還不夠

  盡管最近大家都說 AI 人才缺口很大,但實際上 AI 相關專業(yè)的研究生數(shù)量仍然不足,這種不足現(xiàn)在主要靠其他非 AI 專業(yè)的學生主動或被動 AI 化來緩解,這不是長久之計。國家如果真的認為人工智能是一個戰(zhàn)略方向,應該在 AI 人才的培養(yǎng)上多一些傾斜,例如分配更多的研究生名額給 AI 專業(yè)。

  5)產(chǎn)學研各自定位仍需優(yōu)化

  近些年,我們會注意到一個現(xiàn)象,就是企業(yè)大學化,大學和機構企業(yè)化。典型的表現(xiàn)就是,企業(yè)在發(fā)文章,而大學科研機構則在做短期的技術。背后的原因很多,包括對 Long-term 基礎研究究竟如何評估值得探討,帽子文化也催生了很多快餐式科研成果等。最近國家也不斷的提出要破“四唯”,但更建議不要采取“一刀切”的科研評價模式,應該根據(jù)不同的領域、不同的人才類型采取不同的評價方式。此外,對企業(yè)科技創(chuàng)新的支持導向性也值得商榷,企業(yè)該做什么樣子的創(chuàng)新,大學和科研機構應該做什么樣的創(chuàng)新,可能要有一個更加正確的分類。

總結

以上是生活随笔為你收集整理的计算所山世光:AI方法论需升级,疫后 AI 将如何发展?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。