看看数据科学家们都在用什么:Github上的十大深度学习项目
本文作者M(jìn)atthew May是一位正在進(jìn)行并行式機(jī)器學(xué)習(xí)算法研究的計(jì)算機(jī)碩士研究生,同時(shí)Matthew也是一位數(shù)據(jù)挖掘研習(xí)者,數(shù)據(jù)發(fā)燒友,熱忱的機(jī)器學(xué)習(xí)科學(xué)家。開源工具在數(shù)據(jù)科學(xué)工作流中起到了愈發(fā)重要的作用。Github十大深度學(xué)習(xí)項(xiàng)目,其中包含了大量的代碼庫(kù),框架以及學(xué)習(xí)資料。看看Github上的人們都在使用哪些工具,都在從哪些資源那里進(jìn)行學(xué)習(xí)。
最新KDnuggets軟件調(diào)查結(jié)果表明,在過去12個(gè)月,73%的數(shù)據(jù)科學(xué)家都會(huì)使用免費(fèi)的數(shù)據(jù)科學(xué)工具。不言而喻,Python和R語言(兩者皆為開源)以及各自的生態(tài)系統(tǒng),是這些免費(fèi)的數(shù)據(jù)科學(xué)工具中,數(shù)據(jù)科學(xué)家們運(yùn)用的最突出、最必不可少的。
Github已成為名副其實(shí)的開源軟件交流中心,其上寄存了幾乎所有想得到的項(xiàng)目類型。深度學(xué)習(xí)在學(xué)術(shù)、研究和興趣方面的普及程度越來越高,并在數(shù)據(jù)科學(xué)方面越來越重要,我們將探索一下Github里出類拔萃的深度學(xué)習(xí)項(xiàng)目。
需要注意的是,大部分人認(rèn)為屬于深度學(xué)習(xí)的一些重要項(xiàng)目并沒有出現(xiàn)在該名單上,原因在于在Github搜索「深度學(xué)習(xí)」時(shí)并沒有涉及到這些項(xiàng)目。
1.?Caffe
Caffe是利用Python和MATLAB兩者結(jié)合創(chuàng)建的深度學(xué)習(xí)程序庫(kù)。由伯克利大學(xué)的伯克利視覺與學(xué)習(xí)中心創(chuàng)辦,如果人們僅把Caffe當(dāng)做計(jì)算機(jī)視覺應(yīng)用是情有可原的;事實(shí)上,這是一個(gè)通用的深度學(xué)習(xí)程序庫(kù),能夠開發(fā)卷積網(wǎng)絡(luò),并創(chuàng)建其他視覺、語音等應(yīng)用。
2. Data Science IPython Notebooks
這是由Donne Martin策劃收集的IPython筆記本。話題涵蓋大數(shù)據(jù)、Hadoop、scikit-learn和科學(xué)Python堆棧以及很多其他方面的內(nèi)容。至于深度學(xué)習(xí),像是TensorFlow、Theano和Caffe之類的框架也均被涵蓋其中,當(dāng)然還有相關(guān)的特定構(gòu)架和概念等。
3. ConvNetJS
由斯坦福博士生Andrej Karpathy寫就,他也一直維持著博客更新。ConvNetJS是一個(gè)由Javascript實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò)及其通用模塊,并且包括大量的基于瀏覽器的實(shí)例。這些文檔和實(shí)例數(shù)不勝數(shù),且非常完整。不要讓javascript和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起的想法把你嚇跑了,這可是個(gè)非常受歡迎而且非常有用的項(xiàng)目。
4.?Keras
Keras也是一種Python深度學(xué)習(xí)程序庫(kù),但它利用了TensorFlow和Theano,這也意味著它可以在目前已知最受歡迎的2個(gè)深度學(xué)習(xí)研發(fā)庫(kù)中的任一個(gè)上運(yùn)行。也是那些越來越多的被形容為非常高級(jí)的庫(kù)之一,而所有這些高等級(jí)庫(kù)都非常相似:抽象化底層的深度學(xué)習(xí)引擎,使使用者可以更快、更便捷以及更靈活地部署神經(jīng)網(wǎng)絡(luò)。Keras支持主流深度學(xué)習(xí)架構(gòu),自帶30秒的快速入門指南,并有著完善的文檔。
5.?MXNet
作為一個(gè)深度學(xué)習(xí)框架,MXNet旨在靈活和高效,并且通過允許混合使用指令式編程及符號(hào)式編程的技巧來提高代碼生產(chǎn)力。這個(gè)項(xiàng)目可以和多種語言綁定,如Python, R, 以及 Julia。同時(shí)MXNet還附帶了一系列神經(jīng)網(wǎng)絡(luò)指南和藍(lán)本。另外值得注意的是,一個(gè)相關(guān)項(xiàng)目用JavaScript在瀏覽器環(huán)境中實(shí)現(xiàn)MXNet,有興趣的朋友可以通過?該鏈接?對(duì)一個(gè)圖形分類模型進(jìn)行測(cè)試。
6.?Qix
這是一個(gè)各種計(jì)算和編程主題有關(guān)資源(包括Node.Js, GoLang和深度學(xué)習(xí))的Github版本庫(kù)。之所以說「似乎(appears)」,是因?yàn)镚ithub版本庫(kù)都是用中文寫的,谷歌提供的翻譯甚至?xí)砀嗖唤狻2贿^,有許多鏈接,所以如果你能說中文或看得懂中文,或許這里有些有價(jià)值的東西。
7. Deeplearning4j
Deeplearning4j是為Java 和Scala打造的一款具有工業(yè)強(qiáng)度的深度學(xué)習(xí)框架。作為唯一值得研究的JVM深度學(xué)習(xí)解決方案之一,它在這個(gè)領(lǐng)域有著明顯的優(yōu)勢(shì)。不僅可以很好地與Hadoop 以及Spark的結(jié)合,它還可以使用GPU。他的文檔和指南也非常可靠。
8. Machine Learning Tutorials
這是一張機(jī)器學(xué)習(xí)和深度學(xué)習(xí)教程,文章和資源的名單。這張列表根據(jù)通過主題進(jìn)行組織,包括了許多與深度學(xué)習(xí)有關(guān)的類別,包括計(jì)算機(jī)視覺,加強(qiáng)學(xué)習(xí)以及各種架構(gòu)。由于內(nèi)容廣泛,幾個(gè)月來,已經(jīng)在社交媒體上小有名氣,你也可以?點(diǎn)擊此處?做些貢獻(xiàn)。
9. DeepLearnToolbox
DeepLeanToolBox是一個(gè)供MATLAB和Octave使用的深度學(xué)習(xí)工具箱。很遺憾,這個(gè)項(xiàng)目現(xiàn)在已被廢棄并停止維護(hù)。其Github版本庫(kù)也指向了在修習(xí)深度學(xué)習(xí)方面頗具價(jià)值的其他選擇:Theano和TensorFlow。
如果說這個(gè)已經(jīng)廢棄的云端版本庫(kù)還有點(diǎn)什么價(jià)值,那就是?這個(gè)鏈接?了, 這本由Yoshua Bengio撰寫的教程被包含在了這個(gè)版本庫(kù)中以作為學(xué)習(xí)人工智能所使用的深度學(xué)習(xí)架構(gòu)的學(xué)習(xí)資源。
10. LISA Lab Deep Learning Tutorials
這個(gè)Github版本庫(kù)匯總了加拿大蒙特利爾大學(xué)的LISA實(shí)驗(yàn)室深度學(xué)習(xí)課程的練習(xí)材料。其介紹文檔摘取如下:
這套練習(xí)材料將介紹你們了解一些最重要的深度學(xué)習(xí)算法,以及展示如何使用Theano運(yùn)行這些算法。
Theano是一個(gè)使撰寫深度學(xué)習(xí)模型變得簡(jiǎn)單,并允許用戶選擇GPU對(duì)他們進(jìn)行訓(xùn)練的python庫(kù)。
點(diǎn)擊?這里?在線查看課程材料原文鏈接
本文永久更新鏈接地址:http://www.linuxidc.com/Linux/2016-01/127621.htm
總結(jié)
以上是生活随笔為你收集整理的看看数据科学家们都在用什么:Github上的十大深度学习项目的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于Apache Spark的机器学习及
- 下一篇: 基于 OpenCV 的人脸识别