日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?

發布時間:2025/3/20 编程问答 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章首發于微信公眾號《有三AI》

【雜談】如何學會看arxiv.org才能不錯過自己研究領域的最新論文?

今天介紹一個用于追蹤arxiv.org平臺上最新論文的工具arxiv-sanity。

作者&編輯? | vivian&言有三

?

01 什么是arxiv-sanity

我們都知道arxiv.org是一個非常大的預印本資源庫,里面有大量的最新的論文,但缺點是瀏覽、搜索和排序不是很方便。這個庫每天會更新大量的論文,如果只是通過手動搜索和瀏覽效率就太低了。

這樣特別容易讓人和一些優秀的有趣兒的論文擦肩而過,這些論文可能是和你的研究領域相關的。所以接下來你可能就能猜到這個arxiv-sanity是干什么用的了。

網址為:http://www.arxiv-sanity.com/

?

02 arxiv-sanity的基本功能

1、便捷的預覽

首先,arxiv-sanity在展示最新更新的文獻時,提供了可讀性更強的縮略圖預覽模式方便讀者來快速預覽,并在縮略圖下方的綠色區域顯示文獻的abstract 。

2.感興趣相關度排序

更重要的是,它可以讓你根據自己的閱讀興趣對文獻進行重新排序。比如這里有一篇關于對人體姿態估計的文獻是你感興趣的,點擊右上角的' rank by tf-idf similarity to this',文獻列表會按照與這篇文章的相關度進行排序,接下來我們會看到arxiv上所有關于人體姿態識別的論文。這個功能是基于TF-DF算法來實現的,效果很好。(一種文檔特征提取法,它是由Salton在1988 年提出。其中TF稱為詞頻,? IDF稱為反文檔頻率, 感興趣的可以自己百度。)

3.個人圖書館

如果你是注冊用戶,在登錄賬戶之后,還可以把自己感興趣的文獻收藏到你的個人圖書館。比如,我喜歡上圖的這篇人體姿態估計的文獻,點擊右上角存盤圖標,(看到了嗎?就在' rank by tf-idf similarity to this'下面),點擊之后就把這篇文獻存在我自己的library里面了。

這時,剛剛黑色的圖標變成了藍色,點擊上面的library標簽,可以看到它出現在了最上方。你可以像這樣收藏很多自己感興趣的文獻。想刪除的時候,在自己的library里面再次點擊那個圖標就可以刪除了。

4.感興趣推薦系統

另外,library不光是用來收藏和跟進自己領域的論文更新進度,arxiv-sanity可以通過你收藏的內容給你推薦你也許會感興趣的論文。具體怎么實現的呢?library內部的論文會被標記為positive,Library之外的論文標記為negative,然后arxiv-sanity基于bigram文本特征提取來訓練你的personal SVM,然后在reconmmended 標簽里推薦給你。點擊recommended標簽你就可以看到最近兩周arxiv-sanity認為你會感興趣的文獻。當然,你也可以通過設置時間來自己篩選,如去年,上個月,上周,昨天和全部,看看自己有沒有錯過什么文獻。

5.看看大家都在看什么

最后,再介紹一下“top recent”標簽。這里面展示的是arxiv-sanity上被用戶收藏最多的文獻。這些文獻也可以按照時間來篩選。即使你不是注冊用戶,你也可以瀏覽到大家都在收藏的文獻。

6.網站代碼開源

在頁面上方可以看到,arxiv-sanity只展示machine learning的論文,如CV,CL等ML的分支領域,因為這是arxiv-sanity作者自己的研究領域。(對,這是人家閑暇時間寫的)。作者已經把arxiv-sanity開源了,所以如果你想根據自己的研究領域新建自己的arxiv-sanity,可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

各分支領域縮寫翻譯如下:

cs.CV: Computer Vision and Pattern Recognition 計算機視覺與模式識別;

cs.CL:Computation and Language 計算語言學;

cs.LG:Learning 機器學習(計算機科學);

cs.AI:Artificial Intelligence 人工智能;

cs.NE:Neural and Evolutionary Computing 神經與演化計算;

stat.ML:Machine Learning 機器學習(統計學)。

好了,就是這樣,趕快用起來吧。

?

總結

能夠及時地找到自己感興趣領域里最新最全的資料,本身就是一種學習能力,如果你有更好的推薦方法和建議,不妨來有三AI分享,一起成長吧。

轉載文章請后臺聯系

侵權必究

感謝各位看官的耐心閱讀,不足之處希望多多指教。后續內容將會不定期奉上,歡迎大家關注有三公眾號 有三AI

與50位技術專家面對面20年技術見證,附贈技術全景圖

總結

以上是生活随笔為你收集整理的【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。