华人AI学者大盘点:清华培养了最多的高层次人才,韩家炜、吴恩达论文被引数“登顶”
2021-02-20 19:32:20
根據(jù) AMiner 學(xué)術(shù)搜索平臺人工智能全球最具影響力學(xué)者榜單,對其中的華人學(xué)者進行分析發(fā)現(xiàn),清華大學(xué)培養(yǎng)了最多的高層次 AI 人才,其中包括本科生 41 名,碩士生 23 名,博士生 23 名;在論文發(fā)表方面,黃煦濤老先生以 1477 篇居首位,美國伊利諾伊大學(xué)香檳分校計算機系教授韓家煒已 1308 篇排名第二;論文被引用數(shù)統(tǒng)計中,韓家煒、吳恩達、孫劍、何愷明等排名前列,分別都有 6 萬以上的被引數(shù).......從 1956 年人工智能概念在達特茅斯會議上首次被提出至今 ,60 余載,人工智能發(fā)展已經(jīng)歷了三次發(fā)展浪潮。
起起落落的同時,人工智能理論和技術(shù)也取得了飛速發(fā)展, 在語音識別、文本識別、視頻識別等感知領(lǐng)域取得了突破,毫無疑問的成為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù)。
人工智能三次浪潮
技術(shù)發(fā)展背后永遠是人類的創(chuàng)新在推動,這期間有許多的先賢名字讓我們耳熟能詳,例如 1950 年提出計算機博弈的克勞德?香農(nóng)( Claude Shannon);1954 年提出圖靈測試的阿蘭?圖靈( Alan Turing);首個提出專家系統(tǒng)的愛德華?費根鮑姆 (Edward Feigenbaum);提出深度學(xué)習(xí)的弗里?辛頓( Geoffrey Hinton)等人。
那么,在過去十年,到底有多少人正在為 AI 的發(fā)展貢獻力量呢?答案是 155408 位。這些優(yōu)秀學(xué)者、研究員、企業(yè)家覆蓋 120 多個國家,主要集中在北美洲、歐洲、東亞地區(qū)。
高層次學(xué)者有多少呢?1833 位。這是根據(jù) AI 2000 人工智能全球最具影響力學(xué)者榜單,結(jié)合學(xué)者 H-指數(shù)、論文數(shù)和影響因子,經(jīng)過去重處理后得出來的數(shù)字。
人工智能領(lǐng)域高層次學(xué)者數(shù)量 TOP10 國家
在 1833 名學(xué)者中,覆蓋了全球 37 個國家。按照國籍劃分,其中美國有 1244 人,占比 62.2%,超過總?cè)藬?shù)的一半以上,中國排在美國之后,位列第二,有 196 人。德國位列第三,是歐洲學(xué)者數(shù)量最多的國家;其余國家的學(xué)者數(shù)量均在 100 人次以下。
于是,我們對 196 名中國學(xué)者,以及部分非中國籍華人學(xué)者進行了全景多維度分析,包括所在機構(gòu),研究領(lǐng)域,論文數(shù),被引數(shù),跨國合作情況,畢業(yè)院校(本、碩、博)等。
?
1所在機構(gòu)和研究領(lǐng)域一覽
從所在機構(gòu)來看,據(jù)不完全統(tǒng)計,清華大學(xué) 20 位、微軟 20 位、香港中文大學(xué) 11 位、加利福尼亞大學(xué) 10 位、浙江大學(xué) 10 位、谷歌 8 位、香港科技大學(xué) 7 位、伊利諾伊大學(xué) 6 位、北京大學(xué) 5 位、復(fù)旦大學(xué) 5 位、南洋理工大學(xué) 5 位、中科院 5 位、阿里巴巴和 Facebook 各 4 位,其他研究者分布在騰訊、上交大、字節(jié)跳動、IBM 等近百機構(gòu)。
圖:部分研究者主要所在機構(gòu)
從研究領(lǐng)域來看,大多數(shù)研究者們都不局限在單一領(lǐng)域,例如香儂科技的李紀(jì)為,其研究領(lǐng)域包括:自然語言處理,多媒體,機器學(xué)習(xí),計算機網(wǎng)絡(luò),信息檢索與推薦;復(fù)旦大學(xué)黃萱菁,其研究領(lǐng)域可以歸納為:自然語言處理,信息檢索與推薦,機器學(xué)習(xí),數(shù)據(jù)挖掘。
當(dāng)然,也有一些學(xué)者專研于單一領(lǐng)域,復(fù)旦大學(xué)的邱錫鵬專注于自然語言處理,清華大學(xué)谷源濤專注于語音識別,大連理工大學(xué)盧湖川專注于計算機視覺等。
從研究熱度來看,詞頻出現(xiàn)最多的研究領(lǐng)域是信息檢索與推薦,占比 14%,排名第二的是計算機視覺,占比 12.56%,排名第三的是數(shù)據(jù)挖掘,占比 12.26%,而機器學(xué)習(xí)、自然語言處理、語音識別也有不少占比。
圖:研究領(lǐng)域詞頻分析
在這些研究者的努力下,近年來中國的 AI 實力有目共睹。例如在自然語言處理領(lǐng)域,百度的能力被認(rèn)為超過谷歌。中國目前在計算機視覺領(lǐng)域的領(lǐng)先企業(yè)以商湯科技、曠視、依圖科技和海康威視等為代表,技術(shù)優(yōu)勢主要體現(xiàn)在人臉識別, 在 2017 年中國在這一領(lǐng)域獲得的專利數(shù)量大約是美國公司的 6 倍。
此外,在語音識別領(lǐng)域,特別是在中文識別和處理上,中國研究機構(gòu)也有著獨特的優(yōu)勢。科大訊飛、依圖科技、百度、騰訊、阿里巴巴等企業(yè)依靠中文用戶,能遠超美國獲得龐大的中文語音數(shù)據(jù)庫,這也為其語音識別 AI 提供了更好的學(xué)習(xí)條件。
?
2論文發(fā)表:14位學(xué)者論文被引6萬+
中國 AI 科研實力的另一個直接表現(xiàn),是發(fā)表的論文數(shù)。從科研論文數(shù)量分布來看,人工智能領(lǐng)域論文發(fā)表量居于前十的國家依次是美國、中國、德國、英國、日本、加拿大、法國、韓國、意大利和澳大利亞。
從上圖可見,中國學(xué)者發(fā)表的論文數(shù)量緊隨美國之后,且遙遙領(lǐng)先于其他國家。
在華人學(xué)者中,每一位學(xué)者的論文發(fā)表數(shù)量呈現(xiàn) “正態(tài)分布”。有接近 25% 的學(xué)者發(fā)表了 100-200 篇論文,20% 的學(xué)者發(fā)表了 300-500 篇論文,19.72% 的學(xué)者發(fā)表了 500-700 篇論文。
而在發(fā)表 700 篇以上論文的學(xué)者中,黃煦濤老先生以 1477 篇居首位,美國伊利諾伊大學(xué)香檳分校計算機系教授韓家煒以 1308 篇排名第二。
另外一些熟悉的名字,例如羅切斯特大學(xué)的羅杰波有 743 篇;新加坡國立大學(xué)終身教授顏水成有 740 篇;哈爾濱工業(yè)大學(xué)的劉挺有 723 篇;微眾銀行的楊強有 704 篇;南京大學(xué)周志華 700 篇。
具體到論文被引數(shù),引用數(shù)在 5000-10000 的學(xué)者數(shù)量最多,一共有 97 位。隨著引用數(shù)的增大,其人數(shù)也越來越少。
論文被引數(shù)在 6 萬及以上的學(xué)者,有 14 位。按照引用次數(shù)排名分別是:韓家煒、吳恩達、孫劍、何愷明、李飛飛、黃煦濤、任少卿、俞士綸、賈揚清、張磊、張祥雨、湯曉鷗和宋曉東。
另外一個有趣的現(xiàn)象是,有些學(xué)者并沒有發(fā)表太多論文,但已經(jīng)取得了 6 萬以上的引用數(shù)量,比如何愷明只發(fā)表了 95 篇,任少卿只發(fā)表了 20 篇,賈揚清只發(fā)表了 61 篇,張祥雨只發(fā)表了 49 篇。
高引論文發(fā)表年份分布不均,但一個共同的趨勢是:大多高引論文發(fā)表在 2009-2017 年,其中 2015 年最多;2009 年和 2010 年緊接其后。
高引論文井噴的近十年,其實也正對應(yīng)著各研究領(lǐng)域的熱度。
以深度學(xué)習(xí)為例,2012 年之后,隨著計算能力的進步和海量訓(xùn)練樣本的支持,深度學(xué)習(xí)技術(shù)走向前臺并急速發(fā)展,較好地解決了人工智能領(lǐng)域的一些重點問題如圖像分析和語音識別等,并帶動了產(chǎn)業(yè)界的廣泛應(yīng)用。2015 年,為紀(jì)念人工智能概念提出 60 周年,學(xué)者 Yann LeCun、 Bengio 和 Hinton 推出了深度學(xué)習(xí)的聯(lián)合綜述。這一年同時是中國學(xué)者發(fā)表高引論文數(shù)最多的一年。
再比如,計算機視覺方面,2012 年 6 月谷歌研究人員 Jeff Dean 和華人學(xué)者吳恩達從 YouTube 視頻中提取了 1000 萬個未標(biāo)記的圖像,訓(xùn)練一個由 16000 個電腦處理器組成的龐大神經(jīng)網(wǎng)絡(luò)。在沒有給出任何識別信息的情況下,人工智能通過深度學(xué)習(xí)算法準(zhǔn)確地從中識別出了貓科動物的照片。
此外,中國 AI 領(lǐng)域?qū)W者積極展開跨國科研論文合作。與中國領(lǐng)域?qū)W者合作最多 10 個國家分別是美國、新加坡、澳大利亞、英國、加拿大、日本、法國、德國、新西蘭和韓國。其中,美國是中國 AI 領(lǐng)域?qū)W者跨國合作最多的國家,兩國領(lǐng)域?qū)W者合作論文量在中外論文合作中占比過半。
而在各個 AI 子領(lǐng)域,中國學(xué)者的跨國合作論文產(chǎn)出數(shù)量差別較大。相對而言,在計算機視覺、經(jīng)典 AI、語音識別、信息檢索與挖掘、機器人、自然語言處理、機器學(xué)習(xí)和多媒體領(lǐng)域,中外合作論文較多,而在芯片技術(shù)、人機交互、知識工程、數(shù)據(jù)挖掘等領(lǐng)域的中外合作論文數(shù)量較少。
?
3學(xué)者培養(yǎng):清華大學(xué)培養(yǎng)了最多的高層次人才
通過對上述高層次華人學(xué)者的畢業(yè)院校進行分析,我們發(fā)現(xiàn)無論本碩博,清華大學(xué)都遙遙領(lǐng)先。
其中,本科畢業(yè)于清華大學(xué)的有 41 位,中國科技大學(xué) 21 位,北大和浙大分別為 19 位和 14 位,復(fù)旦、哈工大、上交大和西安交大都是 9 位。其他學(xué)校,例如天津大學(xué)、西安電子科技大學(xué)、香港科技大學(xué)也都培養(yǎng)了多位高層次人才。
圖:部分學(xué)者本科畢業(yè)院校統(tǒng)計
碩士畢業(yè)情況仍然是清華第一,但是情況稍有不同的是,麻省理工和伊利諾伊大學(xué)進入前十。
圖:部分學(xué)者碩士畢業(yè)院校統(tǒng)計
而在博士畢業(yè)院校的排名上,“格局”又有所不同:排名前十的院校中,國外高校整體數(shù)量大幅增加,達到了一半。
出現(xiàn)以上現(xiàn)象的原因可能是,美國本科比較強調(diào)基礎(chǔ)性學(xué)科,而 AI 這種混合性質(zhì)專業(yè)在本科階段是沒有的。進一步分類,AI 屬于計算機科學(xué)的領(lǐng)域,卡內(nèi)基梅隆、加州伯克利、斯坦福大學(xué)、佐治亞理工、加州理工在計算機專業(yè)都比較強,也是華人學(xué) AI 留學(xué)的首選之地。
圖:部分學(xué)者博士畢業(yè)院校統(tǒng)計
以上是 AI 2000 高層次人才中,196 位華人學(xué)者的基本情況。在這些人才的加持下,相信不久的將來會有更多的人工智能關(guān)鍵技術(shù)實現(xiàn)突破,我國人工智能的發(fā)展也將更加耀眼,培養(yǎng)更多的人才投入到人工智能領(lǐng)域的發(fā)展建設(shè)中去。
總結(jié)
以上是生活随笔為你收集整理的华人AI学者大盘点:清华培养了最多的高层次人才,韩家炜、吴恩达论文被引数“登顶”的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。