天才少年何恺明:高考状元的开挂人生
根據(jù)科學(xué)研究,人類大腦皮層的70%活動都在處理視覺信息。如果人工智能賦予機器能夠像人類一樣思考、處理事情的能力,計算機視覺將承擔(dān)巨大作用。作為一門研究如何使機器“看”的科學(xué),計算機視覺已成為人工智能的重要分支,等同于人工智能的大門。
提到計算機視覺研究,就不得不提起近年來一個冉冉升起的“學(xué)術(shù)新星”——何愷明。從高考滿分狀元到“CVPR最佳論文獎”第一位華人得主,再到“深度殘差網(wǎng)絡(luò)”在ImageNet比賽中擊敗谷歌等公司奪得第一……“80后”的他早已眾多光環(huán)加身。在學(xué)界,他被視為天才少年,也被稱為“大神”,不斷地為學(xué)界提供著諸多有分量的研究成果。
何愷明
從小就成為“別人家的孩子”
用“年少成名”形容何愷明一點不為過,因為他曾是萬千學(xué)生和家長都膜拜的對象——高考狀元。
出生于廣州的何愷明是家中獨子,父母均在企業(yè)里從事管理工作,從小就接觸到優(yōu)良的教學(xué)環(huán)境。實際上,能從眾多學(xué)子中脫穎而出,除了教學(xué)環(huán)境之外,更多的是靠自己的努力。
何愷明年少時就被送到少年宮學(xué)習(xí)繪畫,有時一待就是大半天,這也不斷使他練就出沉穩(wěn)的性格。同繪畫一樣,他對于文化課的鉆研也十分耐得住性子,學(xué)習(xí)成績優(yōu)秀而且穩(wěn)定。在老師的心目中,他是一個“性格比較內(nèi)向”但是“目標(biāo)明確”的學(xué)生,“從小就立志上清華”。
高中時,何愷明憑借全國物理競賽一等獎被保送進清華大學(xué)機械工程及其自動化專業(yè)。不過,他卻依然選擇繼續(xù)參加考試,并憑借著扎實的基本功和輕松的心態(tài)一舉成為2003年的廣東省高考狀元。
憑實力進入清華的何愷明,放棄了原本保送的專業(yè),轉(zhuǎn)而選擇了更有挑戰(zhàn)性的基礎(chǔ)科學(xué)班。成立于1998年的基礎(chǔ)科學(xué)班是清華大學(xué)設(shè)立的一個跨系跨學(xué)科的尖子班,本科學(xué)生不僅要學(xué)習(xí)物理系、數(shù)學(xué)系的大部分基礎(chǔ)課程,還要接受一定的科學(xué)研究的實際訓(xùn)練。
大學(xué)期間,何愷明繼續(xù)著自己沉穩(wěn)而優(yōu)秀的表現(xiàn),不僅連續(xù)3年獲得清華獎學(xué)金,2007年,還未畢業(yè)的他就進入了微軟亞洲研究院(MSRA)實習(xí)。
何愷明和導(dǎo)師湯曉鷗
本科畢業(yè)后,他進入香港中文大學(xué)攻讀研究生,師從AI名人湯曉鷗。同時繼續(xù)參與MSRA的工作。2009年,他的第一篇論文“Single ImageHaze Removalusing Dark Channel Prior”被計算機視覺領(lǐng)域頂級會議CVPR接收并被評為年度最佳論文,這是CVPR創(chuàng)辦25年來華人學(xué)者第一次獲此殊榮,也使何愷明在CV領(lǐng)域聲名鵲起。
受游戲啟發(fā)的CVPR最佳論文
然而,彼時剛剛涉足CV領(lǐng)域的何愷明,卻并非一帆風(fēng)順。
在MSRA實習(xí)時,他并未選擇自己擅長的物理和數(shù)學(xué)工作組,而是根據(jù)自己的研究興趣選擇了形象計算組。盡管他曾在大學(xué)的時候選修過計算機圖形圖像的相關(guān)課程,但是并非科班出身的他,興趣也難以支撐工作的需要。
背景知識的缺乏使他在入門的路上舉步維艱。回憶起那段時光,何愷明曾表示,自己在閱讀文章的時候,常常都不知道哪些是大家都在用的方法,哪些才是作者的貢獻(xiàn)。一切對他來說都是新的。
盡管有導(dǎo)師孫劍這樣的學(xué)術(shù)大牛帶著他進行課題研究,自身穩(wěn)定而刻苦的品格也推動著他不斷挑戰(zhàn)困難,但在換過多次課題后,全部都以失敗告終。
雖然結(jié)果對何愷明來說是殘酷的,但是他也從中學(xué)習(xí)到了很多,尤其是多個研究課題的經(jīng)歷使他嘗試了許多不同的方向,而MSRA輕松自由的研究方向也為他日后的科研奠定了牢固的基礎(chǔ)。
其中,何愷明花了大量時間研究的image matting問題 (半透明物體邊界提取),就為他日后研究的“去霧算法”帶來很大幫助。在剛開始研究去霧的時候,何愷明發(fā)現(xiàn)霧的方程和matting的方程非常相似,而之前所研究的matting框架可以給去霧帶來幫助。利用這個框架,只需要找到一個能局部估算霧的濃度的方法就足夠了。
他在2009年獲“CVPR最佳論文獎”的那篇論文,研究的正是圖像的去霧技術(shù),它可以還原圖像的顏色和能見度,同時也能利用霧的濃度來估計物體的距離,這些在計算機視覺上都有重要應(yīng)用(例如三維重建,物體識別)。
北京灰霾照片的去霧結(jié)果
難以想象的是,他最初對去霧研究的靈感竟是來源于電腦游戲。何愷明發(fā)現(xiàn),3D游戲里有很多帶有霧的場景,但這些場景都是虛構(gòu)的不實在的東西。計算機生成的3D圖像會與自然圖像的統(tǒng)計規(guī)律有很大區(qū)別,但人的視覺系統(tǒng)卻仍然能感覺到虛擬圖像中存在的霧。這讓他相信,人的視覺系統(tǒng)一定有一種有效的機制來感知有霧的圖像,而且這種機制一定與現(xiàn)存的去霧方法不一樣。
根據(jù)何愷明算法處理的圖像,上為原圖下為處理后
與之前的方法不同,何愷明把注意力放到了無霧圖像的統(tǒng)計特征上。在無霧圖像中,每一個局部區(qū)域都很有可能會有陰影,或者是純顏色的東西,又或者是黑色的東西。因此,每一個局部區(qū)域都很有可能有至少一個顏色通道會有很低的值。他把這個統(tǒng)計規(guī)律叫做Dark Channel Prior。
即使有了想法和實驗結(jié)果,第一次寫文章也使何愷明覺得非常困難。他經(jīng)常陷入自己和自己吵架的角色當(dāng)中。在每一段話寫好之后,常常會質(zhì)問自己事情到底是不是這樣的,這其中有沒有漏洞。他也會思考,如果自己是評委,或者是讀者,能看懂這篇文章嗎,怎么寫才能讓思路更加流暢?
就在這樣的掙扎中,何愷明的一稿通常要寫好幾天。每當(dāng)他把自己說服了,孫劍還是總能提出新的質(zhì)疑。就在這樣的循環(huán)中,終于有一天孫劍說文章已經(jīng)寫得不錯了,他才開始具體的修改。正是這樣的苛刻要求,才會有后來高質(zhì)量的文章。
因為熱愛,所以一次又一次選擇走研究的路
2011年,博士畢業(yè)的何愷明正式加入MSRA計算機視覺和深度學(xué)習(xí)的研究工作。在2015年的ImageNet圖像識別大賽中,何愷明和他的團隊?wèi){借152層深度殘差網(wǎng)絡(luò)ResNet-152,擊敗谷歌、英特爾、高通等業(yè)界團隊,榮獲第一。目前ResNets也已經(jīng)成為計算機視覺領(lǐng)域的流行架構(gòu),同時也被用于機器翻譯、語音合成、語音識別和AlphaGo的研發(fā)上。
2016年,何愷明憑借ResNets論文再次獲得CVPR最佳論文獎,也是目前少有的一人兩次獲得CVPR最佳論文獎的學(xué)者。
后來,何愷明和孫劍相繼離開MSRA。與孫劍的選擇不同,何凱明走得還是那條學(xué)院路。他選擇了去Facebook,擔(dān)任其人工智能實驗室研究科學(xué)家,選擇了進一步走學(xué)術(shù)之路。
在Facebook AI實驗室研究期間,何凱明仍然醉心于研究,而且頗有建樹。2017年3月,何愷明和同事公布了其最新的研究Mask R-CNN,提出了一個概念上簡單、靈活和通用的用于目標(biāo)實例分割(object instance segmentation)框架,能夠有效地檢測圖像中的目標(biāo),同時還能為每個實例生成一個高質(zhì)量的分割掩碼。同年,憑借《利用焦點損失提升物體檢測效果》這篇論文,他一舉奪下了另一個計算機視覺頂級會議ICCV最佳論文獎。
ICCV 2017最佳論文
2018年,何愷明在美國鹽湖城召開的CVPR上,獲得了PAMI青年研究者獎。幾個月前,何愷明等人發(fā)表論文稱,ImageNet預(yù)訓(xùn)練卻并非必須。何愷明和其同事使用隨機初始化的模型,不借助外部數(shù)據(jù)就取得了不遜于COCO 2017冠軍的結(jié)果,再次引發(fā)業(yè)內(nèi)關(guān)注。
無論是在MSRA還是在FAIR,何愷明始終以他沉穩(wěn)而優(yōu)秀的表現(xiàn),一路過關(guān)斬將,為學(xué)術(shù)界帶來許多重磅的研究成果。有人曾表示,孫劍選擇加盟企業(yè),而何愷明似乎還在不知人間疾苦地奮斗在研究領(lǐng)域,但是雖然道不同,最終為行業(yè)所做貢獻(xiàn)卻是相同的。
總結(jié)
以上是生活随笔為你收集整理的天才少年何恺明:高考状元的开挂人生的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么说“人生苦短,我用Python”?
- 下一篇: GitHub最火热的30个开源机器学习框