田渊栋教你读paper的正确姿势
作為入行數年的專業科研從業者,你每周看幾篇論文?
這是一個知乎上的問題。作為卡耐基梅隆大學機器人系的畢業生、Facebook人工智能研究室(FAIR)的研究人員,田淵棟給出了下面這個回答。
盲目追求論文數量無意義,知道怎么讀更重要。
背景:人工智能,強化學習
追求數目沒有意義。讀文章一般兩個目的:
1. 看大家在做什么,找方向。
這時候一般讀讀Abstract和Introduction,對領域有初步了解,知道它主要關于什么,搞清一些概念的含義和聯系。這時候不懂沒關系,多看幾篇文章就懂了。一般聰明的人這一步可以做得很快。
2. 搞清細節
找一個自己感興趣的方向精讀,把里面的課題思路和推理細節搞明白,并且還要順藤摸瓜找到其它大量的相關文獻繼續讀下去。標準是在腦里能有對這個領域有清楚的脈絡,能做到獨立完成大部分推導和證明。
一個靠譜的檢查方法是給同組的人或者導師做個講座,看他們能聽懂不。很多時候自己以為懂了,其實和別人一說馬上就露出馬腳。同時討論也可以激發新思路,說不定就能找到下一篇文章的出發點。這一步往往會花費一個科研人員大量時間,也是業余和職業科研的關鍵區別所在。
總之分配給每篇文章的時間天差地別。爛文幾秒鐘就可以放棄,而經典文章還需要每過一陣子回頭再去看一看想一想。至于如何評判文章質量,那就得要靠長年科研積累出來的品味了。
接下來的兩個階段就不是光看論文可以看出來的。
3. 寫代碼實現別人的工作,并且改進
每篇文章都會有意或者無意抬高自己貶低別人,都存在一些有意或者無意隱藏的細節,這些不親手做是看不到的。所以得要動手花時間去實現別人的方法,想方設法達到別人的效果,然后反過來再看看文章。
時間長了馬上就會學到故意隱藏的蛛絲馬跡,理解別人留白的道理。光看文章的話,這類經驗的積累要慢很多。一般說的“紙上談兵”就是指這一步沒做。
我在15年1月剛去Facebook AI Research的時候,在深度學習上還沒有實際操作經驗。交給我的第一件事情是復現VGG在ImageNet上的性能,那時還沒有BatchNorm,跑5個有2個能開始收斂的就不錯了,最后花了幾周搞定了。整個過程讓我學到不少經驗。
4. 總結經驗,融會貫通,找到并且遵循自己的方法論
重復3很多次之后,可能會覺得自己比較有經驗了。別人問起的時候也能侃侃而談,但說的往往是一些分散且孤立的經驗。并且你會發現自己很容易遺忘這些經驗,這個并不是因為記憶力不好,而是因為思路不系統。
這個就需要反復思考反復提煉,從而形成自己的方法論。有了方法論之后,心里就有大方向而不會隨便亂試亂撞,效率就會高很多,并且能在一個科研方向上挖很深堅持很久,而不是哪個課題熱做哪個。在指導別人的時候也可以做到有的放矢。
在這個基礎上再看文獻,往往就會讀懂很多一開始讀不懂的東西。比如說為什么作者要強調A而否認B,那是因為他相信A后面的哲學和方法論。
如果你發現自己提煉不了,或者本來知識就是凌亂的,那么要么就是(1)境界未到,要么就是(2)領域還沒有成熟,目前的知識點只是零碎的拼湊。(1)要靠自己練,(2)則預示著大機遇,一個研究者牛不牛就看他是不是可以在別人都放棄的地方找到新的規律。
一般完成1是新聞及科普的水平,2到3是博士生低年級至高年級的水平,精通3到初入4是博后的水平,精通4則是研究員和教授的水準。
另外,從1到4并沒有特別固定的順序,可能你在某個領域是4,另一個領域還只是1或2的程度;或者你在4中獲得的經驗能反過來幫助1和2(這個很常見);或者一上來就可以跳過2做3,然后等3有了結果之后再去補2,等等。當然,一步跳到4那是民科的水平。
還可以直接參與討論~
————
編輯?∑Pluto
來源:新浪科技·量子位
微信公眾號“算法數學之美”,由算法與數學之美團隊打造的另一個公眾號,歡迎大家掃碼關注!
更多精彩:
?如何向5歲小孩解釋什么是支持向量機(SVM)?
?自然底數e的意義是什么?
?費馬大定理,集驚險與武俠于一體
?簡單的解釋,讓你秒懂“最優化” 問題
?一分鐘看懂一維空間到十維空間
??本科、碩士和博士到底有什么區別?
?小波變換通俗解釋
?微積分必背公式
?影響計算機算法世界的十位大師
?數據挖掘之七種常用的方法
算法數學之美微信公眾號歡迎賜稿
稿件涉及數學、物理、算法、計算機、編程等相關領域,經采用我們將奉上稿酬。
投稿郵箱:math_alg@163.com
總結
以上是生活随笔為你收集整理的田渊栋教你读paper的正确姿势的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基因编辑婴儿追踪:该被编辑的是我们的心
- 下一篇: 数学家与诗人,都是这个世界上先知先觉的预