當前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

计算所山世光：AI方法论需升级，疫后 AI 将如何发展？

發(fā)布時間：2023/11/22 综合教程 39 生活家

生活随笔收集整理的這篇文章主要介紹了计算所山世光：AI方法论需升级，疫后 AI 将如何发展？小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

　　雷鋒網(wǎng) AI 科技評論按：曾被譽為人工智能的三駕馬車——算法、算力、數(shù)據(jù)，到了需要反思的時刻。特別是深度學習在學術前沿的后續(xù)發(fā)展乏力，恐難支撐 AI 能力繼續(xù)升級。

　　步入新的十年后，如今 AI 可能已經(jīng)到了一個拐點時刻。

　　那么接下來，AI 技術將如何發(fā)展、應用？隨著國內(nèi)疫情的結束，這逐漸成為領域內(nèi)眾多研究者和從業(yè)者亟需回答的一個關鍵問題。

　　4 月 9 日，中國科協(xié)學會學術部、中國科學報聯(lián)合騰訊科協(xié)、騰訊發(fā)展研究辦公室舉辦了一場非常及時的線上論壇活動，主題為“人工智能：科技與經(jīng)濟融合新引擎”。眾多學者專家紛紛回答了疫后人工智能科技與經(jīng)濟融合發(fā)展的諸多問題。

　　雷鋒網(wǎng) AI 科技評論本著對人工智能技術重點關注，選取中科院計算所研究員、中科視拓創(chuàng)始人山世光的報告內(nèi)容做以整理，分享給大家。

　　山世光研究員的報告分為兩大部分，先是從研究的角度，他認為 AI 方法論將從「數(shù)據(jù)驅動」轉向「知識+數(shù)據(jù)聯(lián)合驅動」；在后一部分，他從行業(yè)發(fā)展的層面提出了五大觀點和建議。這些內(nèi)容具有深刻的洞見性。

　　1、從學術前沿視角來看，深度學習已成強弩之末

　　在過去十年里，人工智能的研究從過去依靠規(guī)則、知識來設計人工智能算法這樣一套方法論，逐漸過渡到了以數(shù)據(jù)為主要驅動力的方法論。

　　在這個方法論的指導下，靠著“三駕馬車”——算法、大數(shù)據(jù)、強算力，支撐起了現(xiàn)在的 AI 能力。算法上主要以深度學習為主，數(shù)據(jù)則強調要足夠大（且是有監(jiān)督的標注數(shù)據(jù)），由于深度學習動輒需要通過訓練設定上億的參數(shù)也導致了非常依賴強大算力的支撐。

　　于是，只要滿足下面兩個條件的 AI 任務，都能夠得到好的解決：

　　1）專用 AI 任務(而非通用 AI)。例如醫(yī)療影像中，看肺炎的 AI 就只能看肺炎，不能看肝炎；看 CT 的 AI 就只能看 CT，不能看核磁。

　　2）“好”數(shù)據(jù)肥沃(通過商業(yè)模式大量獲取數(shù)據(jù))。所謂好數(shù)據(jù)，一方面要有較大的規(guī)模，另一方面則是要有好的標注。

　　但這樣的 AI，離我們所期望的相距甚遠。

　　微軟亞洲研究院院長洪小文博士曾提出如下的 AI 能力金字塔（黃色字體是山世光增加內(nèi)容）：

　　按照這種金字塔層次，目前的 AI 技術仍還停留在第二層的「感知和簡單推理」上面，也即相當于非人類靈長類動物的層次。

　　如何更進一步，向上做到認知、情感、創(chuàng)造，甚至智慧呢？

　　山世光認為我們至少需要做以下幾種能力的提升——

　　然而，現(xiàn)有的 AI 方法論并不足以支撐 AI 能力繼續(xù)升級。

　　首先，算法、算力、數(shù)據(jù)這三架馬車已略顯疲軟。算力提升和大數(shù)據(jù)收集都需要投入資源，但算法卻大多是一個模型對一個任務，現(xiàn)在是問題很多，方法卻有限。

　　其次，深度學習在工業(yè)界還在靠大數(shù)據(jù)和大算力進行應用研究，由于沒有強大的理論支撐，有些算力和數(shù)據(jù)會浪費在試錯上，這一點現(xiàn)在已經(jīng)變得越來越明顯。

　　而另一方面，在學術前沿上，深度學習顯示出的潛力有限。為什么呢？因為它本身無法克服高度數(shù)據(jù)依賴問題，無法像人一樣基于“弱”、“小”數(shù)據(jù)進行精確而且魯棒的學習！現(xiàn)有研究還都寄希望于基于深度學習來解決數(shù)據(jù)依賴的問題，希望能夠賦予機器學習從弱監(jiān)督、小數(shù)據(jù)來學習的能力，但從原理上來說，如果沒有別的數(shù)據(jù)或知識做支撐，這幾乎是不可能的。我們必須找到全新的方法。

　　2、未來 10 年的 AI 方法論：知識+數(shù)據(jù)聯(lián)合驅動

　　AI 能力的升級，必須依賴 AI 方法論的升級，而這歸結到本質，還是算法的革新。

　　山世光研究員提出如下幾種亟需發(fā)展的 AI 算法——

舉例來說，算法能否在數(shù)據(jù)量減小到原來 10% 甚至1%，同時還保持和原來相當?shù)哪芰δ?？在現(xiàn)有的算法（純數(shù)據(jù)驅動）中，是否可以加入知識，或者已有的其他數(shù)據(jù)或模型，做到知識和數(shù)據(jù)聯(lián)合驅動？……事實上，已經(jīng)有許多研究單位在做，也是當下 AI 算法上最值得探索的幾個研究方向之一。

　　針對以上內(nèi)容，山世光從「數(shù)據(jù)依賴」的角度做了詳細說明。前面提到，當前人工智能的方法是強大 (強監(jiān)督、大規(guī)模) 數(shù)據(jù)依賴。但我們知道人類智能并不是如此，簡單舉幾例人類的能力：

歸納和演繹推理：從個別到一般，再從一般到個別；
舉一反三&觸類旁通：類似推演&遷移學習；
吃一塹長一智：從少量錯誤中學習(修改模型)；
預測檢驗：時刻預測并修正誤差;自糾錯學習；
元方法：道生一，一生二，二生三，三生萬物；
融會貫通：多模態(tài)、多學科知識校驗和融合；
想象力和創(chuàng)造力：無中生有，外插而非內(nèi)插。

　　從這些能力中，我們可以看出，人類的智能本質上是一種知識+弱小(弱監(jiān)督、小樣本)數(shù)據(jù)驅動的方法。這種特性值得我們參考。

　　山世光研究員認為，人類能夠做到小數(shù)據(jù)的學習，原因在于有知識的積累。因此如何把知識融合到機器當中，對于 AI 算法非常重要。這里的知識既可能是人類總結出的知識，也可以是已有 AI 學到的知識，他把后面這種知識稱之為“機器知識”。

　　所謂“機器知識”，不同于“人類知識”，很可能不是人類可閱讀的，甚至不是人類可理解的。如山世光研究員所說，當我們已經(jīng)用算法解決了N個任務（例如識別人臉、猴臉、馬臉、狗臉、牛臉等）后，機器就有可能從這些任務中總結出一些通用任務的規(guī)則，作為“元”模型。

　　有了“機器知識”，即使是小數(shù)據(jù)/無數(shù)據(jù)的任務，也能夠獲得好的性能。例如可以借助上述從人 / 猴、馬、狗、牛等學習到的臉部識別模型，得出一個關于臉的“元”模型，用來識別考拉臉、魚臉、熊貓臉等。

　　（現(xiàn)在的方法則往往是，識別一個動物，就要收集大量這個動物的臉部照片，換種動物就得重新收集和學習，既不高效，也不優(yōu)雅，甚至笨拙的有點可笑。）

　　事實上，這種研究本質上是多任務協(xié)同的問題，在 2018 年已經(jīng)有人在做，CVPR 2018 的最佳論文正是其中的代表，這個工作研究了 26 個不同任務之間的關系，以及如何可以互相支撐，從而減少對標注數(shù)據(jù)的需求。

　　基于以上的分析，山世光研究員認為，AI 的方法論，在過去十年逐漸變?yōu)橐詮?、大?shù)據(jù)驅動為主，但接下來的十年或更長時間里，知識和數(shù)據(jù)聯(lián)合驅動將成為主流。當然這里的知識，并不僅僅指人類可以理解的知識，也可能是許多人類無法理解的“機器知識”。

　　3、五大觀點&建議

　　在報告的后半部分，山世光研究員針對目前我國的人工智能發(fā)展，提出了五大觀點和建議，如下：

　　1）AI 應用研究方面差距不大

　　中美（歐）之間在應用研究上差距不大，但我們在各行業(yè)縱深應用（即在其他研究領域）上仍需努力。例如，AI 在生物信息領域的應用，西方的積淀很多，深度學習也滲透了很多，而我國在這方面就需要努力趕超。

　　2）AI 基礎研究方面差距不容小覷

　　中美(歐)差距在縮小，但中國加速度不夠。過去十年最具代表性的方法主要還是來自歐美大學或企業(yè)，平起平坐恐怕至少還需要5-10 年或更久。我們存在的問題在于，對基礎研究長期性的認知不足，缺乏起碼的耐心！重大基礎研究項目評估周期過短，甚至要求技術路線清晰，2 年出成果。但基礎研究往往是“無心插柳柳成蔭，有心栽花花不開”。以深度卷積神經(jīng)網(wǎng)絡(DCNN)為例，它是 1980 年代的產(chǎn)物，過了近 20 年才開始發(fā)揮出威力。

　　3）AI 基礎設施方面差距不小

　　這包括三個方面，分別是硬件、軟件和智件。

　　國內(nèi)在基礎硬件平臺上的投入很大，但存在重復建設，尚未形成合力，不能充分發(fā)揮效力；另外由于深度學習的理論基礎較為薄弱，無效試錯導致算力浪費的現(xiàn)象也存在。

　　而另一方面，在基礎軟件平臺上中國投入需要提升（相較北美至少落后4-8 年），深度學習的主流底層框架（TensorFlow，Pytorch，MxNet）主要還是由北美國家建設，10 年后，這方面可能會恰如今日之“芯片產(chǎn)業(yè)”，成為我們的“隱患”；最近中國有不少企業(yè)單位（百度，華為，曠視，清華，鵬城實驗室...）相繼發(fā)布或擬發(fā)布開源框架，希望能形成合力。山世光建議，針對低門檻的 AI 研發(fā)平臺和工具，我們需要盡快搶占先機。

　　此外，山世光建議，我們在基礎智件體系投入上要加大(包括基礎算法研究)，建議加強基礎智件體系研究：從過去已有的計算中心和數(shù)據(jù)中心開始，如何建設算法中心，知識中心等，建議盡快建設國家級的“知識中心”，包括人類知識中心（通用知識+領域知識）和機器知識（成熟 AI 算法和模型）中心，做到已實現(xiàn)的 AI 算法可以像水、電、煤一樣取用，從而避免大量重復勞動。

　　4）AI 人才培養(yǎng)的傾斜力度還不夠

　　盡管最近大家都說 AI 人才缺口很大，但實際上 AI 相關專業(yè)的研究生數(shù)量仍然不足，這種不足現(xiàn)在主要靠其他非 AI 專業(yè)的學生主動或被動 AI 化來緩解，這不是長久之計。國家如果真的認為人工智能是一個戰(zhàn)略方向，應該在 AI 人才的培養(yǎng)上多一些傾斜，例如分配更多的研究生名額給 AI 專業(yè)。

　　5）產(chǎn)學研各自定位仍需優(yōu)化

　　近些年，我們會注意到一個現(xiàn)象，就是企業(yè)大學化，大學和機構企業(yè)化。典型的表現(xiàn)就是，企業(yè)在發(fā)文章，而大學科研機構則在做短期的技術。背后的原因很多，包括對 Long-term 基礎研究究竟如何評估值得探討，帽子文化也催生了很多快餐式科研成果等。最近國家也不斷的提出要破“四唯”，但更建議不要采取“一刀切”的科研評價模式，應該根據(jù)不同的領域、不同的人才類型采取不同的評價方式。此外，對企業(yè)科技創(chuàng)新的支持導向性也值得商榷，企業(yè)該做什么樣子的創(chuàng)新，大學和科研機構應該做什么樣的創(chuàng)新，可能要有一個更加正確的分類。

總結

以上是生活随笔為你收集整理的计算所山世光：AI方法论需升级，疫后 AI 将如何发展？的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：降薪减支、暂停招生招聘，哈佛、MIT等全
下一篇：外卖小哥用上科幻电影中的高科技：背负10