日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习资料汇总

發(fā)布時間:2023/12/20 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习资料汇总 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.


  • 《Brief History of Machine Learning》

介紹:這是一篇介紹機(jī)器學(xué)習(xí)歷史的文章,介紹很全面,從感知機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹、SVM、Adaboost到隨機(jī)森林、Deep Learning.

  • 《Deep Learning in Neural Networks: An Overview》

介紹:這是瑞士人工智能實驗室Jurgen Schmidhuber寫的最新版本《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)綜述》本綜述的特點是以時間排序,從1940年開始講起,到60-80年代,80-90年代,一 直講到2000年后及最近幾年的進(jìn)展。涵蓋了deep learning里各種tricks,引用非常全面.

  • 《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》

介紹:這是一份python機(jī)器學(xué)習(xí)庫,如果您是一位python工程師而且想深入的學(xué)習(xí)機(jī)器學(xué)習(xí).那么這篇文章或許能夠幫助到你.

  • 《How to Layout and Manage Your Machine Learning Project》

介紹:這一篇介紹如果設(shè)計和管理屬于你自己的機(jī)器學(xué)習(xí)項目的文章,里面提供了管理模版、數(shù)據(jù)管理與實踐方法.

  • 《Machine Learning is Fun!》

介紹:如果你還不知道什么是機(jī)器學(xué)習(xí),或則是剛剛學(xué)習(xí)感覺到很枯燥乏味。那么推薦一讀。這篇文章已經(jīng)被翻譯成中文,如果有興趣可以移步http://blog.jobbole.com/67616/

  • 《R語言參考卡片》

介紹:R語言是機(jī)器學(xué)習(xí)的主要語言,有很多的朋友想學(xué)習(xí)R語言,但是總是忘記一些函數(shù)與關(guān)鍵字的含義。那么這篇文章或許能夠幫助到你

  • 《Choosing a Machine Learning Classifier》

介紹:我該如何選擇機(jī)器學(xué)習(xí)算法,這篇文章比較直觀的比較了Naive Bayes,Logistic Regression,SVM,決策樹等方法的優(yōu)劣,另外討論了樣本大小、Feature與Model權(quán)衡等問題。此外還有已經(jīng)翻譯了的版本:http://www.52ml.net/15063.html

  • 《An Introduction to Deep Learning: From Perceptrons to Deep Networks》

介紹:深度學(xué)習(xí)概述:從感知機(jī)到深度網(wǎng)絡(luò),作者對于例子的選擇、理論的介紹都很到位,由淺入深。翻譯版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html

  • 《The LION Way: Machine Learning plus Intelligent Optimization》

    介紹:<機(jī)器學(xué)習(xí)與優(yōu)化>這是一本機(jī)器學(xué)習(xí)的小冊子, 短短300多頁道盡機(jī)器學(xué)習(xí)的方方面面. 圖文并茂, 生動易懂, 沒有一坨坨公式的煩惱. 適合新手入門打基礎(chǔ), 也適合老手溫故而知新. 比起MLAPP/PRML等大部頭, 也許這本你更需要!具體內(nèi)容推薦閱讀:http://intelligent-optimization.org/LIONbook/

  • 《深度學(xué)習(xí)與統(tǒng)計學(xué)習(xí)理論》

介紹:作者是來自百度,不過他本人已經(jīng)在2014年4月份申請離職了。但是這篇文章很不錯如果你不知道深度學(xué)習(xí)與支持向量機(jī)/統(tǒng)計學(xué)習(xí)理論有什么聯(lián)系?那么應(yīng)該立即看看這篇文章.

  • 《計算機(jī)科學(xué)中的數(shù)學(xué)》

介紹:這本書是由谷歌公司和MIT共同出品的計算機(jī)科學(xué)中的數(shù)學(xué):Mathematics for Computer Science,Eric Lehman et al 2013 。分為5大部分:1)證明,歸納。2)結(jié)構(gòu),數(shù)論,圖。3)計數(shù),求和,生成函數(shù)。4)概率,隨機(jī)行走。5)遞歸。等等

  • 《信息時代的計算機(jī)科學(xué)理論(Foundations of Data Science)》

介紹:信息時代的計算機(jī)科學(xué)理論,目前國內(nèi)有紙質(zhì)書購買,iTunes購買

  • 《Data Science with R》

介紹:這是一本由雪城大學(xué)新編的第二版《數(shù)據(jù)科學(xué)入門》教材:偏實用型,淺顯易懂,適合想學(xué)習(xí)R語言的同學(xué)選讀。

  • 《Twenty Questions for Donald Knuth》

介紹:這并不是一篇文檔或書籍。這是篇向圖靈獎得主Donald Knuth提問記錄稿: 近日, Charles Leiserson, Al Aho, Jon Bentley等大神向Knuth提出了20個問題,內(nèi)容包括TAOCP,P/NP問題,圖靈機(jī),邏輯,以及為什么大神不用電郵等等。

  • 《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》

介紹:不會統(tǒng)計怎么辦?不知道如何選擇合適的統(tǒng)計模型怎么辦?那這篇文章你的好好讀一讀了麻省理工Joshua B. Tenenbaum和劍橋Zoubin Ghahramani合作,寫了一篇關(guān)于automatic statistician的文章。可以自動選擇回歸模型類別,還能自動寫報告...

  • 《ICLR 2014論文集》

介紹:對深度學(xué)習(xí)和representation learning最新進(jìn)展有興趣的同學(xué)可以了解一下

  • 《Introduction to Information Retrieval》

介紹:這是一本信息檢索相關(guān)的書籍,是由斯坦福Manning與谷歌副總裁Raghavan等合著的Introduction to Information Retrieval一直是北美最受歡迎的信息檢索教材之一。最近作者增加了該課程的幻燈片和作業(yè)。IR相關(guān)資源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html

  • 《Machine learning in 10 pictures》

介紹:Deniz Yuret用10張漂亮的圖來解釋機(jī)器學(xué)習(xí)重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity.很清晰

  • 《雅虎研究院的數(shù)據(jù)集匯總》

介紹:雅虎研究院的數(shù)據(jù)集匯總: 包括語言類數(shù)據(jù),圖與社交類數(shù)據(jù),評分與分類數(shù)據(jù),計算廣告學(xué)數(shù)據(jù),圖像數(shù)據(jù),競賽數(shù)據(jù),以及系統(tǒng)類的數(shù)據(jù)。

  • 《An Introduction to Statistical Learning with Applications in R》

介紹:這是一本斯坦福統(tǒng)計學(xué)著名教授Trevor Hastie和Robert Tibshirani的新書,并且在2014年一月已經(jīng)開課:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about

  • Best Machine Learning Resources for Getting Started

介紹:機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總是專為機(jī)器學(xué)習(xí)初學(xué)者推薦的優(yōu)質(zhì)學(xué)習(xí)資源,幫助初學(xué)者快速入門。而且這篇文章的介紹已經(jīng)被翻譯成中文版。如果你不怎么熟悉,那么我建議你先看一看中文的介紹。

  • My deep learning reading list

介紹:主要是順著Bengio的PAMI review的文章找出來的。包括幾本綜述文章,將近100篇論文,各位山頭們的Presentation。全部都可以在google上找到。

  • Cross-Language Information Retrieval

介紹:這是一本書籍,主要介紹的是跨語言信息檢索方面的知識。理論很多

  • 探索推薦引擎內(nèi)部的秘密,第 1 部分: 推薦引擎初探

介紹:本文共有三個系列,作者是來自IBM的工程師。它主要介紹了推薦引擎相關(guān)算法,并幫助讀者高效的實現(xiàn)這些算法。?探索推薦引擎內(nèi)部的秘密,第 2 部分: 深度推薦引擎相關(guān)算法 - 協(xié)同過濾,探索推薦引擎內(nèi)部的秘密,第 3 部分: 深度推薦引擎相關(guān)算法 - 聚類

  • 《Advice for students of machine learning》

介紹:康奈爾大學(xué)信息科學(xué)系助理教授David Mimno寫的《對機(jī)器學(xué)習(xí)初學(xué)者的一點建議》, 寫的挺實際,強(qiáng)調(diào)實踐與理論結(jié)合,最后還引用了馮 ? 諾依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."

  • 分布式并行處理的數(shù)據(jù)

介紹:這是一本關(guān)于分布式并行處理的數(shù)據(jù)《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,作者是斯坦福的James L. McClelland。著重介紹了各種神級網(wǎng)絡(luò)算法的分布式實現(xiàn),做Distributed Deep Learning 的童鞋可以參考下

  • 《“機(jī)器學(xué)習(xí)”是什么?》

介紹:【“機(jī)器學(xué)習(xí)”是什么?】John Platt是微軟研究院杰出科學(xué)家,17年來他一直在機(jī)器學(xué)習(xí)領(lǐng)域耕耘。近年來機(jī)器學(xué)習(xí)變得炙手可熱,Platt和同事們遂決定開設(shè)博客,向公眾介紹機(jī)器學(xué)習(xí)的研究進(jìn)展。機(jī)器學(xué)習(xí)是什么,被應(yīng)用在哪里?來看Platt的這篇博文

  • 《2014年國際機(jī)器學(xué)習(xí)大會ICML 2014 論文》

介紹:2014年國際機(jī)器學(xué)習(xí)大會(ICML)已經(jīng)于6月21-26日在國家會議中心隆重舉辦。本次大會由微軟亞洲研究院和清華大學(xué)聯(lián)手主辦,是這 個有著30多年歷史并享譽(yù)世界的機(jī)器學(xué)習(xí)領(lǐng)域的盛會首次來到中國,已成功吸引海內(nèi)外1200多位學(xué)者的報名參與。干貨很多,值得深入學(xué)習(xí)下

  • 《Machine Learning for Industry: A Case Study》

介紹:這篇文章主要是以Learning to Rank為例說明企業(yè)界機(jī)器學(xué)習(xí)的具體應(yīng)用,RankNet對NDCG之類不敏感,加入NDCG因素后變成了LambdaRank,同樣的思想從神經(jīng)網(wǎng)絡(luò) 改為應(yīng)用到Boosted Tree模型就成就了LambdaMART。Chirs Burges,微軟的機(jī)器學(xué)習(xí)大神,Yahoo 2010 Learning to Rank Challenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最為突出,代表論文為:?From RankNet to LambdaRank to LambdaMART: An Overview?此外,Burges還有很多有名的代表作,比如:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning

  • 100 Best GitHub: Deep Learning

介紹:100 Best GitHub: Deep Learning

  • 《UFLDL-斯坦福大學(xué)Andrew Ng教授“Deep Learning”教程》

介紹:本教程將闡述無監(jiān)督特征學(xué)習(xí)和深度學(xué)習(xí)的主要觀點。通過學(xué)習(xí),你也將實現(xiàn)多個功能學(xué)習(xí)/深度學(xué)習(xí)算法,能看到它們?yōu)槟愎ぷ?#xff0c;并學(xué)習(xí)如何應(yīng)用 /適應(yīng)這些想法到新問題上。本教程假定機(jī)器學(xué)習(xí)的基本知識(特別是熟悉的監(jiān)督學(xué)習(xí),邏輯回歸,梯度下降的想法),如果你不熟悉這些想法,我們建議你去這里機(jī)器學(xué)習(xí)課程,并先完成第II,III,IV章(到邏輯回歸)。此外這關(guān)于這套教程的源代碼在github上面已經(jīng)有python版本了?UFLDL Tutorial Code

*《Deep Learning for Natural Language Processing and Related Applications》

介紹:這份文檔來自微軟研究院,精髓很多。如果需要完全理解,需要一定的機(jī)器學(xué)習(xí)基礎(chǔ)。不過有些地方會讓人眼前一亮,毛塞頓開。

  • Understanding Convolutions

介紹:這是一篇介紹圖像卷積運算的文章,講的已經(jīng)算比較詳細(xì)的了

  • 《Machine Learning Summer School》

介紹:每天請一個大牛來講座,主要涉及機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,并行計算以及人腦研究。https://www.youtube.com/user/smolix?(國內(nèi)或許不能訪問)

  • 《Awesome Machine Learning》

介紹:一個超級完整的機(jī)器學(xué)習(xí)開源庫總結(jié),如果你認(rèn)為這個碉堡了,那后面這個列表會更讓你驚訝:【Awesome Awesomeness】,國內(nèi)已經(jīng)有熱心的朋友進(jìn)行了翻譯中文介紹,機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘免費電子書

  • 斯坦?!蹲匀徽Z言處理》課程視頻

介紹:ACL候任主席、斯坦福大學(xué)計算機(jī)系Chris Manning教授的《自然語言處理》課程所有視頻已經(jīng)可以在斯坦福公開課網(wǎng)站上觀看了(如Chrome不行,可用IE觀看) 作業(yè)與測驗也可以下載。

  • 《Deep Learning and Shallow Learning》

介紹:對比 Deep Learning 和 Shallow Learning 的好文,來著浙大畢業(yè)、MIT 讀博的 Chiyuan Zhang 的博客。

  • 《Recommending music on Spotify with deep learning》

介紹:利用卷積神經(jīng)網(wǎng)絡(luò)做音樂推薦。

  • 《Neural Networks and Deep Learning》

介紹:神經(jīng)網(wǎng)絡(luò)的免費在線書,已經(jīng)寫了三章了,還有對應(yīng)的開源代碼:https://github.com/mnielsen/neural-networks-and-deep-learning?愛好者的福音。

  • 《Java Machine Learning》

介紹:Java機(jī)器學(xué)習(xí)相關(guān)平臺和開源的機(jī)器學(xué)習(xí)庫,按照大數(shù)據(jù)、NLP、計算機(jī)視覺和Deep Learning分類進(jìn)行了整理。看起來挺全的,Java愛好者值得收藏。

  • 《Machine Learning Theory: An Introductory Primer》

介紹:機(jī)器學(xué)習(xí)最基本的入門文章,適合零基礎(chǔ)者

  • 《機(jī)器學(xué)習(xí)常見算法分類匯總》

介紹:機(jī)器學(xué)習(xí)的算法很多。很多時候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來的。這里,我們從兩個方面來給大家介紹,第一個方面是學(xué)習(xí)的方式,第二個方面是算法的類似性。

  • 《機(jī)器學(xué)習(xí)經(jīng)典論文/survey合集》

介紹:看題目你已經(jīng)知道了是什么內(nèi)容,沒錯。里面有很多經(jīng)典的機(jī)器學(xué)習(xí)論文值得仔細(xì)與反復(fù)的閱讀。

  • 《機(jī)器學(xué)習(xí)視頻庫》

介紹:視頻由加州理工學(xué)院(Caltech)出品。需要英語底子。

  • 《機(jī)器學(xué)習(xí)經(jīng)典書籍》

介紹:總結(jié)了機(jī)器學(xué)習(xí)的經(jīng)典書籍,包括數(shù)學(xué)基礎(chǔ)和算法理論的書籍,可做為入門參考書單。

  • 《16 Free eBooks On Machine Learning》

介紹:16本機(jī)器學(xué)習(xí)的電子書,可以下載下來在pad,手機(jī)上面任意時刻去閱讀。不多我建議你看完一本再下載一本。

  • 《A Large set of Machine Learning Resources for Beginners to Mavens》

介紹:標(biāo)題很大,從新手到專家。不過看完上面所有資料??隙ㄊ菍<伊?/p>

  • 《機(jī)器學(xué)習(xí)最佳入門學(xué)習(xí)資料匯總》

介紹:入門的書真的很多,而且我已經(jīng)幫你找齊了。

  • 《Sibyl》

介紹:Sibyl 是一個監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來解決預(yù)測方面的問題,比如 YouTube 的視頻推薦。

  • 《Deep Learning》

介紹:Yoshua Bengio, Ian Goodfellow, Aaron Courville著

  • 《Neural Network & Text Mining》

介紹:關(guān)于(Deep) Neural Networks在 NLP 和 Text Mining 方面一些paper的總結(jié)

  • 《前景目標(biāo)檢測1(總結(jié))》

介紹:計算機(jī)視覺入門之前景目標(biāo)檢測1(總結(jié))

  • 《行人檢測》

介紹:計算機(jī)視覺入門之行人檢測

  • 《Deep Learning – important resources for learning and understanding》

介紹:Important resources for learning and understanding . Is awesome

  • 《Machine Learning Theory: An Introductory Primer》

介紹:這又是一篇機(jī)器學(xué)習(xí)初學(xué)者的入門文章。值得一讀

  • 《Neural Networks and Deep Learning》

介紹:在線Neural Networks and Deep Learning電子書

  • 《Python 網(wǎng)頁爬蟲 & 文本處理 & 科學(xué)計算 & 機(jī)器學(xué)習(xí) & 數(shù)據(jù)挖掘兵器譜》

介紹:python的17個關(guān)于機(jī)器學(xué)習(xí)的工具

  • 《神奇的伽瑪函數(shù)(上)》

介紹:下集在這里神奇的伽瑪函數(shù)(下)

  • 《分布式機(jī)器學(xué)習(xí)的故事》

介紹:作者王益目前是騰訊廣告算法總監(jiān),王益博士畢業(yè)后在google任研究。這篇文章王益博士7年來從谷歌到騰訊對于分布機(jī)器學(xué)習(xí)的所見所聞。值得細(xì)讀

  • 《機(jī)器學(xué)習(xí)提升之道(Level-Up Your Machine Learning)》

介紹:把機(jī)器學(xué)習(xí)提升的級別分為0~4級,每級需要學(xué)習(xí)的教材和掌握的知識。這樣,給機(jī)器學(xué)習(xí)者提供一個上進(jìn)的路線圖,以免走彎路。另外,整個網(wǎng)站都是關(guān)于機(jī)器學(xué)習(xí)的,資源很豐富。

  • 《Machine Learning Surveys》

介紹:機(jī)器學(xué)習(xí)各個方向綜述的網(wǎng)站

  • 《Deep Learning Reading list》

介紹:深度學(xué)習(xí)閱資源列表

  • 《Deep Learning: Methods and Applications》

介紹:這是一本來自微的研究員 li Peng和Dong Yu所著的關(guān)于深度學(xué)習(xí)的方法和應(yīng)用的電子書

  • 《Machine Learning Summer School 2014》

介紹:2014年七月CMU舉辦的機(jī)器學(xué)習(xí)夏季課剛剛結(jié)束 有近50小時的視頻、十多個PDF版幻燈片,覆蓋 深度學(xué)習(xí),貝葉斯,分布式機(jī)器學(xué)習(xí),伸縮性 等熱點話題。所有13名講師都是牛人:包括大牛Tom Mitchell (他的[機(jī)器學(xué)習(xí)]是名校的常用教材),還有CMU李沐 .(1080P高清喲)

  • 《Sibyl: 來自Google的大規(guī)模機(jī)器學(xué)習(xí)系統(tǒng)》

介紹:在今年的IEEE/IFIP可靠系統(tǒng)和網(wǎng)絡(luò)(DSN)國際會議上,Google軟件工程師Tushar Chandra做了一個關(guān)于Sibyl系統(tǒng)的主題演講。 Sibyl是一個監(jiān)督式機(jī)器學(xué)習(xí)系統(tǒng),用來解決預(yù)測方面的問題,比如YouTube的視頻推薦。詳情請閱讀google sibyl

  • 《Building a deeper understanding of images》

介紹:谷歌研究院的Christian Szegedy在谷歌研究院的博客上簡要地介紹了他們今年參加ImageNet取得好成績的GoogLeNet系統(tǒng).是關(guān)于圖像處理的。

  • 《Bayesian network 與python概率編程實戰(zhàn)入門》

介紹:貝葉斯學(xué)習(xí)。如果不是很清可看看概率編程語言與貝葉斯方法實踐

  • 《AMA: Michael I Jordan》

介紹:網(wǎng)友問伯克利機(jī)器學(xué)習(xí)大牛、美國雙料院士Michael I. Jordan:"如果你有10億美金,你怎么花?Jordan: "我會用這10億美金建造一個NASA級別的自然語言處理研究項目。"

  • 《機(jī)器學(xué)習(xí)&數(shù)據(jù)挖掘筆記_16(常見面試之機(jī)器學(xué)習(xí)算法思想簡單梳理)》

介紹:常見面試之機(jī)器學(xué)習(xí)算法思想簡單梳理,此外作者還有一些其他的機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘文章和深度學(xué)習(xí)文章,不僅是理論還有源碼。

  • 《文本與數(shù)據(jù)挖掘視頻匯總》

介紹:Videolectures上最受歡迎的25個文本與數(shù)據(jù)挖掘視頻匯總

  • 《怎么選擇深度學(xué)習(xí)的GPUs》

介紹:在Kaggle上經(jīng)常取得不錯成績的Tim Dettmers介紹了他自己是怎么選擇深度學(xué)習(xí)的GPUs, 以及個人如何構(gòu)建深度學(xué)習(xí)的GPU集群:?http://t.cn/RhpuD1G

  • 《對話機(jī)器學(xué)習(xí)大神Michael Jordan:深度模型》

介紹:對話機(jī)器學(xué)習(xí)大神Michael Jordan

  • 《Deep Learning 和 Knowledge Graph 引爆大數(shù)據(jù)革命》

介紹:還有2,3部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html

  • 《Deep Learning 教程翻譯》

介紹:是Stanford 教授 Andrew Ng 的 Deep Learning 教程,國內(nèi)的機(jī)器學(xué)習(xí)愛好者很熱心的把這個教程翻譯成了中文。如果你英語不好,可以看看這個

  • 《Deep Learning 101》

介紹:因為近兩年來,深度學(xué)習(xí)在媒體界被炒作很厲害(就像大數(shù)據(jù))。其實很多人都還不知道什么是深度學(xué)習(xí)。這篇文章由淺入深。告訴你深度學(xué)究竟是什么!

  • 《UFLDL Tutorial》

介紹:這是斯坦福大學(xué)做的一免費課程(很勉強(qiáng)),這個可以給你在深度學(xué)習(xí)的路上給你一個學(xué)習(xí)的思路。里面提到了一些基本的算法。而且告訴你如何去應(yīng)用到實際環(huán)境中。中文版

  • 《Toronto Deep Learning Demos》

介紹:這是多倫多大學(xué)做的一個深度學(xué)習(xí)用來識別圖片標(biāo)簽/圖轉(zhuǎn)文字的demo。是一個實際應(yīng)用案例。有源碼

  • 《Deep learning from the bottom up》

介紹:機(jī)器學(xué)習(xí)模型,閱讀這個內(nèi)容需要有一定的基礎(chǔ)。

  • 《R工具包的分類匯總》

介紹: (CRAN Task Views, 34種常見任務(wù),每個任務(wù)又各自分類列舉若干常用相關(guān)工具包) 例如: 機(jī)器學(xué)習(xí),自然語言處理,時間序列分析,空間信息分析,多重變量分析,計量經(jīng)濟(jì)學(xué),心理統(tǒng)計學(xué),社會學(xué)統(tǒng)計,化學(xué)計量學(xué),環(huán)境科學(xué),藥物代謝動力學(xué) 等

  • 《機(jī)器學(xué)習(xí)常見算法分類匯總》

介紹: 機(jī)器學(xué)習(xí)無疑是當(dāng)前數(shù)據(jù)分析領(lǐng)域的一個熱點內(nèi)容。很多人在平時的工作中都或多或少會用到機(jī)器學(xué)習(xí)的算法。本文為您總結(jié)一下常見的機(jī)器學(xué)習(xí)算法,以供您在工作和學(xué)習(xí)中參考.

  • 《Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列》

介紹: 很多干貨,而且作者還總結(jié)了好幾個系列。另外還作者還了一個文章導(dǎo)航.非常的感謝作者總結(jié)。

Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(二)

Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(三)

Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(四)

Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(五)

Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(六)

Deep Learning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(七)

DeepLearning(深度學(xué)習(xí))學(xué)習(xí)筆記整理系列之(八)

  • 《Tutorials Session A - Deep Learning for Computer Vision》

介紹:傳送理由:Rob Fergus的用深度學(xué)習(xí)做計算機(jī)是覺的NIPS 2013教程。有mp4, mp3, pdf各種下載?他是紐約大學(xué)教授,目前也在Facebook工作,他2014年的8篇論文

  • 《FudanNLP》

介紹:FudanNLP,這是一個復(fù)旦大學(xué)計算機(jī)學(xué)院開發(fā)的開源中文自然語言處理(NLP)工具包 Fudan NLP里包含中文分詞、關(guān)鍵詞抽取、命名實體識別、詞性標(biāo)注、時間詞抽取、語法分析等功能,對搜索引擎 文本分析等極為有價值。

  • 《Open Sourcing ml-ease》

介紹:LinkedIn 開源的機(jī)器學(xué)習(xí)工具包,支持單機(jī), Hadoop cluster,和 Spark cluster 重點是 logistic regression 算法

  • 《機(jī)器學(xué)習(xí)周刊》

介紹:對于英語不好,但又很想學(xué)習(xí)機(jī)器學(xué)習(xí)的朋友。是一個大的福利。機(jī)器學(xué)習(xí)周刊目前主要提供中文版,還是面向廣大國內(nèi)愛好者,內(nèi)容涉及機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、并行系統(tǒng)、圖像識別、人工智能、機(jī)器人等等。謝謝作者

  • 《線性代數(shù)》

介紹:《線性代數(shù)》是《機(jī)器學(xué)習(xí)》的重要數(shù)學(xué)先導(dǎo)課程。其實《線代》這門課講得淺顯易懂特別不容易,如果一上來就講逆序數(shù)及羅列行列式性質(zhì),很容易讓學(xué)生失去學(xué)習(xí)的興趣。我個人推薦的最佳《線性代數(shù)》課程是麻省理工Gilbert Strang教授的課程。?課程主頁

  • 《Big-data》

介紹:大數(shù)據(jù)數(shù)據(jù)處理資源、工具不完備列表,從框架、分布式編程、分布式文件系統(tǒng)、鍵值數(shù)據(jù)模型、圖數(shù)據(jù)模型、數(shù)據(jù)可視化、列存儲、機(jī)器學(xué)習(xí)等。很贊的資源匯總。

  • 《machine learning for smart dummies》

介紹:雅虎邀請了一名來自本古里安大學(xué)的訪問學(xué)者,制作了一套關(guān)于機(jī)器學(xué)習(xí)的系列視頻課程。本課程共分為7期,詳細(xì)講解了有關(guān)SVM, boosting, nearest neighbors, decision trees 等常規(guī)機(jī)器學(xué)習(xí)算法的理論基礎(chǔ)知識。

  • 《Entanglement-Based Quantum Machine Learning》

介紹:應(yīng)對大數(shù)據(jù)時代,量子機(jī)器學(xué)習(xí)的第一個實驗?paper 下載

  • 《How a Math Genius Hacked OkCupid to Find True Love》

介紹:Wired雜志報道了UCLA數(shù)學(xué)博士Chris McKinlay (圖1)通過大數(shù)據(jù)手段+機(jī)器學(xué)習(xí)方法破解婚戀網(wǎng)站配對算法找到真愛的故事,通過Python腳本控制著12個賬號,下載了婚戀網(wǎng)站2萬女用戶的600萬 問題答案,對他們進(jìn)行了統(tǒng)計抽樣及聚類分析(圖2,3),最后終于收獲了真愛??萍几淖兠\!

  • 《Underactuated Robotics》

介紹:MIT的Underactuated Robotics于 2014年10月1日開課,該課屬于MIT研究生級別的課程,對機(jī)器人和非線性動力系統(tǒng)感興趣的朋友不妨可以挑戰(zhàn)一下這門課程!

  • 《mllib實踐經(jīng)驗(1)》

介紹:mllib實踐經(jīng)驗分享

  • 《Google Turns To Deep Learning Classification To Fight Web Spam》

介紹:Google用Deep Learning做的antispam(反垃圾郵件)

  • 《NLP常用信息資源》

介紹:NLP常用信息資源*?《NLP常用信息資源》

  • 《機(jī)器學(xué)習(xí)速查表》

介紹:機(jī)器學(xué)習(xí)速查表

  • 《Best Papers vs. Top Cited Papers in Computer Science》

介紹:從1996年開始在計算機(jī)科學(xué)的論文中被引用次數(shù)最多的論文

  • 《InfiniTAM: 基于深度圖像的體數(shù)據(jù)集成框架》

介紹:把今年的一個ACM Trans. on Graphics (TOG)論文中的代碼整理為一個開源的算法框架,共享出來了。歡迎大家使用??梢詫崟r的采集3D數(shù)據(jù)、重建出三維模型。Online learning,GPU Random forest,GPU CRF也會后續(xù)公開。

  • 《Hacker's guide to Neural Networks》

介紹:【神經(jīng)網(wǎng)絡(luò)黑客指南】現(xiàn)在,最火莫過于深度學(xué)習(xí)(Deep Learning),怎樣更好學(xué)習(xí)它?可以讓你在瀏覽器中,跑起深度學(xué)習(xí)效果的超酷開源項目convnetjs作者karpathy告訴你,最佳技巧是, 當(dāng)你開始寫代碼,一切將變得清晰。他剛發(fā)布了一本圖書,不斷在線更新

  • 《Building a Production Machine Learning Infrastructure》

介紹:前Google廣告系統(tǒng)工程師Josh Wills 講述工業(yè)界和學(xué)術(shù)界機(jī)器學(xué)習(xí)的異同,大實話

  • 《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》

介紹:使用Neo4j?做電影評論的情感分析。

  • 《DeepLearning.University – An Annotated Deep Learning Bibliography》

介紹:不僅是資料,而且還對有些資料做了注釋。

  • 《A primer on deeping learning》

介紹:深度學(xué)習(xí)入門的初級讀本

  • 《Machine learning is teaching us the secret to teaching 》

介紹:機(jī)器學(xué)習(xí)教會了我們什么?

  • 《scikit-learn:用于機(jī)器學(xué)習(xí)的Python模塊》

介紹:scikit-learn是在SciPy基礎(chǔ)上構(gòu)建的用于機(jī)器學(xué)習(xí)的Python模塊。

  • 《對話機(jī)器學(xué)習(xí)大神Michael Jordan:解析領(lǐng)域中各類模型》

介紹:喬丹教授(Michael I. Jordan)教授是機(jī)器學(xué)習(xí)領(lǐng)域神經(jīng)網(wǎng)絡(luò)的大牛,他對深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)有著很濃厚的興趣。因此,很多提問的問題中包含了機(jī)器學(xué)習(xí)領(lǐng)域的各類模型,喬丹教授對此一一做了解釋和展望。

  • 《A*搜索算法的可視化短教程》

介紹:A*搜索是人工智能基本算法,用于高效地搜索圖中兩點的最佳路徑, 核心是 g(n)+h(n): g(n)是從起點到頂點n的實際代價,h(n)是頂點n到目標(biāo)頂點的估算代價。合集

  • 《基于云的自然語言處理開源項目FudanNLP》

介紹:本項目利用了Microsoft Azure,可以在幾分種內(nèi)完成NLP on Azure Website的部署,立即開始對FNLP各種特性的試用,或者以REST API的形式調(diào)用FNLP的語言分析功能

  • 《吳立德《概率主題模型&數(shù)據(jù)科學(xué)基礎(chǔ)》》

介紹:現(xiàn)任復(fù)旦大學(xué)首席教授、計算機(jī)軟件博士生導(dǎo)師。計算機(jī)科學(xué)研究所副所長.內(nèi)部課程

  • 《機(jī)器學(xué)習(xí)入門資源不完全匯總》》

介紹:好東西的干貨真的很多

  • 《收集從2014年開始深度學(xué)習(xí)文獻(xiàn)》

介紹:從硬件、圖像到健康、生物、大數(shù)據(jù)、生物信息再到量子計算等,Amund Tveit等維護(hù)了一個DeepLearning.University小項目:收集從2014年開始深度學(xué)習(xí)文獻(xiàn),相信可以作為深度學(xué)習(xí)的起點,github

  • 《EMNLP上兩篇關(guān)于股票趨勢的應(yīng)用論文 》

介紹:EMNLP上兩篇關(guān)于stock trend?用到了deep model組織特征;?Exploiting Social Relations and Sentiment for Stock Prediction用到了stock network。

  • 《Bengio組(蒙特利爾大學(xué)LISA組)深度學(xué)習(xí)教程 》

介紹:作者是深度學(xué)習(xí)一線大牛Bengio組寫的教程,算法深入顯出,還有實現(xiàn)代碼,一步步展開。

  • 《學(xué)習(xí)算法的Neural Turing Machine 》

介紹:許多傳統(tǒng)的機(jī)器學(xué)習(xí)任務(wù)都是在學(xué)習(xí)function,不過谷歌目前有開始學(xué)習(xí)算法的趨勢。谷歌另外的這篇學(xué)習(xí)Python程序的Learning to Execute也有相似之處

  • 《Learning to Rank for Information Retrieval and Natural Language Processing》

介紹:作者是華為技術(shù)有限公司,諾亞方舟實驗室,首席科學(xué)家的李航博士寫的關(guān)于信息檢索與自然語言處理的文章

  • 《Rumor has it: Identifying Misinformation in Microblogs》

介紹:利用機(jī)用器學(xué)習(xí)在謠言的判別上的應(yīng)用,此外還有兩個。一個是識別垃圾與虛假信息的paper.還有一個是網(wǎng)絡(luò)輿情及其分析技術(shù)

  • 《R機(jī)器學(xué)習(xí)實踐》

介紹:該課程是網(wǎng)易公開課的收費課程,不貴,超級便宜。主要適合于對利用R語言進(jìn)行機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘感興趣的人。

  • 《大數(shù)據(jù)分析:機(jī)器學(xué)習(xí)算法實現(xiàn)的演化》

介紹:本章中作者總結(jié)了三代機(jī)器學(xué)習(xí)算法實現(xiàn)的演化:第一代非分布式的, 第二代工具如Mahout和Rapidminer實現(xiàn)基于Hadoop的擴(kuò)展,第三代如Spark和Storm實現(xiàn)了實時和迭代數(shù)據(jù)處理。BIG DATA ANALYTICS BEYOND HADOOP

  • 《圖像處理,分析與機(jī)器視覺》

介紹:講計算機(jī)視覺的四部奇書(應(yīng)該叫經(jīng)典吧)之一,另外三本是Hartley的《多圖幾何》、Gonzalez的《數(shù)字圖像處理》、Rafael C.Gonzalez / Richard E.Woods 的《數(shù)字圖像處理》

  • 《LinkedIn最新的推薦系統(tǒng)文章Browsemaps》

介紹:里面基本沒涉及到具體算法,但作者介紹了CF在LinkedIn的很多應(yīng)用,以及他們在做推薦過程中獲得的一些經(jīng)驗。最后一條經(jīng)驗是應(yīng)該監(jiān)控log數(shù)據(jù)的質(zhì)量,因為推薦的質(zhì)量很依賴數(shù)據(jù)的質(zhì)量!

  • 《初學(xué)者如何查閱自然語言處理(NLP)領(lǐng)域?qū)W術(shù)資料》

介紹:初學(xué)者如何查閱自然語言處理(NLP)領(lǐng)域?qū)W術(shù)資料

  • 《樹莓派的人臉識別教程》

介紹:用樹莓派和相機(jī)模塊進(jìn)行人臉識別

  • 《利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對話系統(tǒng) 》

介紹:如何利用深度學(xué)習(xí)與大數(shù)據(jù)構(gòu)建對話系統(tǒng)

  • 《經(jīng)典論文Leo Breiman:Statistical Modeling: The Two Cultures 》

介紹:Francis Bach合作的有關(guān)稀疏建模的新綜述(書):Sparse Modeling for Image and Vision Processing,內(nèi)容涉及Sparsity, Dictionary Learning, PCA, Matrix Factorization等理論,以及在圖像和視覺上的應(yīng)用,而且第一部分關(guān)于Why does the l1-norm induce sparsity的解釋也很不錯。

  • 《Reproducing Kernel Hilbert Space》

介紹:RKHS是機(jī)器學(xué)習(xí)中重要的概念,其在large margin分類器上的應(yīng)用也是廣為熟知的。如果沒有較好的數(shù)學(xué)基礎(chǔ),直接理解RKHS可能會不易。本文從基本運算空間講到Banach和Hilbert空間,深入淺出,一共才12頁。

  • 《Hacker's guide to Neural Networks》

介紹:許多同學(xué)對于機(jī)器學(xué)習(xí)及深度學(xué)習(xí)的困惑在于,數(shù)學(xué)方面已經(jīng)大致理解了,但是動起手來卻不知道如何下手寫代碼。斯坦福深度學(xué)習(xí)博士Andrej Karpathy寫了一篇實戰(zhàn)版本的深度學(xué)習(xí)及機(jī)器學(xué)習(xí)教程,手把手教你用Javascript寫神經(jīng)網(wǎng)絡(luò)和SVM.

  • 《【語料庫】語料庫資源匯總》

介紹:【語料庫】語料庫資源匯總

  • 《機(jī)器學(xué)習(xí)算法之旅》

介紹:本文會過一遍最流行的機(jī)器學(xué)習(xí)算法,大致了解哪些方法可用,很有幫助。

  • 《Reproducible Research in Computational Science》

介紹:這個里面有很多關(guān)于機(jī)器學(xué)習(xí)、信號處理、計算機(jī)視覺、深入學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的大量源代碼(或可執(zhí)行代碼)及相關(guān)論文??蒲袑懻撐牡暮觅Y源

  • 《NYU 2014年的深度學(xué)習(xí)課程資料》

介紹:NYU 2014年的深度學(xué)習(xí)課程資料,有視頻

  • 《計算機(jī)視覺數(shù)據(jù)集不完全匯總》

介紹:計算機(jī)視覺數(shù)據(jù)集不完全匯總

  • 《Machine Learning Open Source Software》

介紹:機(jī)器學(xué)習(xí)開源軟件

  • 《LIBSVM》

介紹:A Library for Support Vector Machines

  • 《Support Vector Machines》

介紹:數(shù)據(jù)挖掘十大經(jīng)典算法之一

  • 《100 Best GitHub: Deep Learning》

介紹:github上面100個非常棒的項目

  • 《加州大學(xué)歐文分校(UCI)機(jī)器學(xué)習(xí)數(shù)據(jù)集倉庫》

介紹:當(dāng)前加州大學(xué)歐文分校為機(jī)器學(xué)習(xí)社區(qū)維護(hù)著306個數(shù)據(jù)集。查詢數(shù)據(jù)集

  • 《Andrej Karpathy個人主頁》

介紹:Andrej Karpathy 是斯坦福大學(xué)Li Fei-Fei的博士生,使用機(jī)器學(xué)習(xí)在圖像、視頻語義分析領(lǐng)域取得了科研和工程上的突破,發(fā)的文章不多,但每個都很扎實,在每一個問題上都做到了state-of-art.

  • 《Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示》

介紹:Andrej Karpathy的深度強(qiáng)化學(xué)習(xí)演示,論文在這里

  • 《CIKM數(shù)據(jù)挖掘競賽奪冠算法-陳運文》

介紹:CIKM Cup(或者稱為CIKM Competition)是ACM CIKM舉辦的國際數(shù)據(jù)挖掘競賽的名稱。

  • 《Geoffrey E. Hinton》

介紹:杰弗里·埃弗里斯特·辛頓 FRS是一位英國出生的計算機(jī)學(xué)家和心理學(xué)家,以其在神經(jīng)網(wǎng)絡(luò)方面的貢獻(xiàn)聞名。辛頓是反向傳播算法和對比散度算法的發(fā)明人之一,也是深度學(xué)習(xí)的積極推動者.

  • 《自然語言處理的深度學(xué)習(xí)理論與實際》

介紹:微軟研究院深度學(xué)習(xí)技術(shù)中心在CIKM2014 上關(guān)于《自然語言處理的深度學(xué)習(xí)理論與實際》教學(xué)講座的幻燈片

  • 《用大數(shù)據(jù)和機(jī)器學(xué)習(xí)做股票價格預(yù)測》

介紹: 本文基于<支持向量機(jī)的高頻限價訂單的動態(tài)建模>采用了 Apache Spark和Spark MLLib從紐約股票交易所的訂單日志數(shù)據(jù)構(gòu)建價格運動預(yù)測模型。(股票有風(fēng)險,投資謹(jǐn)慎)GitHub源代碼托管地址.

  • 《關(guān)于機(jī)器學(xué)習(xí)的若干理論問題》

介紹:徐宗本 院士將于熱愛機(jī)器學(xué)習(xí)的小伙伴一起探討有關(guān)于機(jī)器學(xué)習(xí)的幾個理論性問題,并給出一些有意義的結(jié)論。最后通過一些實例來說明這些理論問題的物理意義和實際應(yīng)用價值。

  • 《深度學(xué)習(xí)在自然語言處理的應(yīng)用》

介紹:作者還著有《這就是搜索引擎:核心技術(shù)詳解》一書,主要是介紹應(yīng)用層的東西

  • 《Undergraduate machine learning at UBC》

介紹:機(jī)器學(xué)習(xí)課程

  • 《人臉識別必讀的N篇文章》

介紹:人臉識別必讀文章推薦

  • 《推薦系統(tǒng)經(jīng)典論文文獻(xiàn)及業(yè)界應(yīng)用》

介紹:推薦系統(tǒng)經(jīng)典論文文獻(xiàn)

  • 《人臉識別必讀的N篇文章》

介紹:人臉識別必讀文章推薦

  • 《第十二屆中國"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會PPT》

介紹:第十二屆中國"機(jī)器學(xué)習(xí)及其應(yīng)用"研討會PPT

  • 《統(tǒng)計機(jī)器學(xué)習(xí)》

介紹:統(tǒng)計學(xué)習(xí)是關(guān)于計算機(jī)基于數(shù)據(jù)構(gòu)建的概率統(tǒng)計模型并運用模型對數(shù)據(jù)進(jìn)行預(yù)測和分析的一門科學(xué),統(tǒng)計學(xué)習(xí)也成為統(tǒng)計機(jī)器學(xué)習(xí)。課程來自上海交通大學(xué)

  • 《機(jī)器學(xué)習(xí)導(dǎo)論》

介紹:機(jī)器學(xué)習(xí)的目標(biāo)是對計算機(jī)編程,以便使用樣本數(shù)據(jù)或以往的經(jīng)驗來解決給定的問題.

  • 《CIKM 2014主題報告的幻燈片》

介紹:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum的主題報告的幻燈片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin的Industry Track報告的幻燈片

  • 《人工智能和機(jī)器學(xué)習(xí)領(lǐng)域有趣的開源項目》

介紹:部分中文列表

  • 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實現(xiàn)--基于SMO的SVM分類器》

介紹:此外作者還有一篇元算法、AdaBoost python實現(xiàn)文章

  • 《Numerical Optimization: Understanding L-BFGS》

介紹:加州伯克利大學(xué)博士Aria Haghighi寫了一篇超贊的數(shù)值優(yōu)化博文,從牛頓法講到擬牛頓法,再講到BFGS以及L-BFGS, 圖文并茂,還有偽代碼。強(qiáng)烈推薦。

  • 《簡明深度學(xué)習(xí)方法概述(一)》

介紹:還有續(xù)集簡明深度學(xué)習(xí)方法概述(二)

  • 《R language for programmers》

介紹:R語言程序員私人定制版

  • 《谷歌地圖解密:大數(shù)據(jù)與機(jī)器學(xué)習(xí)的結(jié)合》

介紹:谷歌地圖解密

  • 《空間數(shù)據(jù)挖掘常用方法》

介紹:空間數(shù)據(jù)挖掘常用方法

  • 《Use Google's Word2Vec for movie reviews》

介紹:Kaggle新比賽 ”When bag of words meets bags of popcorn“ aka ”邊學(xué)邊用word2vec和deep learning做NLP“ 里面全套教程教一步一步用python和gensim包的word2vec模型,并在實際比賽里面比調(diào)參數(shù)和清數(shù)據(jù)。 如果已裝過gensim不要忘升級

  • 《PyNLPIR》

介紹:PyNLPIR提供了NLPIR/ICTCLAS漢語分詞的Python接口,此外Zhon提供了常用漢字常量,如CJK字符和偏旁,中文標(biāo)點,拼音,和漢字正則表達(dá)式(如找到文本中的繁體字)

  • 《深度卷積神經(jīng)網(wǎng)絡(luò)下圍棋》

介紹:這文章說把最近模型識別上的突破應(yīng)用到圍棋軟件上,打16萬張職業(yè)棋譜訓(xùn)練模型識別功能。想法不錯。訓(xùn)練后目前能做到不用計算,只看棋盤就給 出下一步,大約10級棋力。但這篇文章太過樂觀,說什么人類的最后一塊堡壘馬上就要跨掉了。話說得太早。不過,如果與別的軟件結(jié)合應(yīng)該還有潛力可挖。@萬 精油墨綠

  • 《NIPS審稿實驗》

介紹:UT Austin教授Eric Price關(guān)于今年NIPS審稿實驗的詳細(xì)分析,他表示,根據(jù)這次實驗的結(jié)果,如果今年NIPS重新審稿的話,會有一半的論文被拒。

  • 《2014年最佳的大數(shù)據(jù),數(shù)據(jù)科學(xué)文章》

介紹:KDNuggets分別總結(jié)了2014年14個閱讀最多以及分享最多的文章。我們從中可以看到多個主題——深度學(xué)習(xí),數(shù)據(jù)科學(xué)家職業(yè),教育和薪酬,學(xué)習(xí)數(shù)據(jù)科學(xué)的工具比如R和Python以及大眾投票的最受歡迎的數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘語言

  • 《機(jī)器學(xué)習(xí)經(jīng)典算法詳解及Python實現(xiàn)--線性回歸(Linear Regression)算法》

介紹:Python實現(xiàn)線性回歸,作者還有其他很棒的文章推薦可以看看

  • 《2014中國大數(shù)據(jù)技術(shù)大會33位核心專家演講PDF》

介紹:2014中國大數(shù)據(jù)技術(shù)大會33位核心專家演講PDF下載

  • 《使用RNN和Paragraph Vector做情感分析》

介紹:這是T. Mikolov & Y. Bengio最新論文Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用RNN和PV在情感分析效果不錯,[項目代碼](https://github.com/mesnilgr/iclr15)公布在github(目前是空的)。這意味著Paragraph?Vector終于揭開面紗了嘛。

  • 《NLPIR/ICTCLAS2015分詞系統(tǒng)大會上的技術(shù)演講 》

介紹:NLPIR/ICTCLAS2015分詞系統(tǒng)發(fā)布與用戶交流大會上的演講,請更多朋友檢閱新版分詞吧。 我們實驗室同學(xué)的演講包括:孫夢姝-基于評論觀點挖掘的商品搜索技術(shù)研究?李然-主題模型

  • 《Machine Learning is Fun!》

介紹:Convex Neural Networks 解決維數(shù)災(zāi)難

  • 《CNN的反向求導(dǎo)及練習(xí)》

介紹:介紹CNN參數(shù)在使用bp算法時該怎么訓(xùn)練,畢竟CNN中有卷積層和下采樣層,雖然和MLP的bp算法本質(zhì)上相同,但形式上還是有些區(qū)別的,很顯然在完成CNN反向傳播前了解bp算法是必須的。此外作者也做了一個資源集:機(jī)器學(xué)習(xí),深度學(xué)習(xí),視覺,數(shù)學(xué)等

  • 《正則表達(dá)式優(yōu)化成Trie樹 》

介紹:如果要在一篇文章中匹配十萬個關(guān)鍵詞怎么辦?Aho-Corasick?算法利用添加了返回邊的Trie樹,能夠在線性時間內(nèi)完成匹配。 但如果匹配十萬個正則表達(dá)式呢 ? 這時候可以用到把多個正則優(yōu)化成Trie樹的方法,如日本人寫的?Regexp::Trie

  • 《Deep learning Reading List》

介紹:深度學(xué)習(xí)閱讀清單

  • 《Caffe》

介紹:Caffe是一個開源的深度學(xué)習(xí)框架,作者目前在google工作,作者主頁Yangqing Jia (賈揚清)

  • 《GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn) 》

介紹:2014 ImageNet冠軍GoogLeNet深度學(xué)習(xí)模型的Caffe復(fù)現(xiàn)模型,GoogleNet論文.

  • 《LambdaNet,Haskell實現(xiàn)的開源人工神經(jīng)網(wǎng)絡(luò)庫 》

介紹:LambdaNetLambdaNet是由Haskell實現(xiàn)的一個開源的人工神經(jīng)網(wǎng)絡(luò)庫,它抽象了網(wǎng)絡(luò)創(chuàng)建、訓(xùn)練并使用了高階函數(shù)。該庫還提供了一組預(yù)定義函數(shù),用戶可以采取多種方式組合這些函數(shù)來操作現(xiàn)實世界數(shù)據(jù)。

  • 《百度余凱&張潼機(jī)器學(xué)習(xí)視頻》

介紹:如果你從事互聯(lián)網(wǎng)搜索,在線廣告,用戶行為分析,圖像識別,自然語言理解,或者生物信息學(xué),智能機(jī)器人,金融預(yù)測,那么這門核心課程你必須深入了解。

  • 《楊強(qiáng)在TEDxNanjing談智能的起源》

介紹:"人工智能研究分許多流派。其中之一以IBM為代表,認(rèn)為只要有高性能計算就可得到智能,他們的‘深藍(lán)’擊敗了世界象棋冠軍;另一流派認(rèn)為智 能來自動物本能;還有個很強(qiáng)的流派認(rèn)為只要找來專家,把他們的思維用邏輯一條條寫下,放到計算機(jī)里就行……" 楊強(qiáng)在TEDxNanjing談智能的起源

  • 《深度RNN/LSTM用于結(jié)構(gòu)化學(xué)習(xí) 0)序列標(biāo)注Connectionist Temporal ClassificationICML06》

介紹:1)機(jī)器翻譯Sequence to Sequence NIPS14?2)成分句法GRAMMAR AS FOREIGN LANGUAGE

  • 《Deep Learning實戰(zhàn)之word2vec》

介紹:網(wǎng)易有道的三位工程師寫的word2vec的解析文檔,從基本的詞向量/統(tǒng)計語言模型->NNLM->Log-Linear /Log-Bilinear->層次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各種tricks, 公式推導(dǎo)與代碼,基本上是網(wǎng)上關(guān)于word2vec資料的大合集,對word2vec感興趣的朋友可以看看

  • 《Machine learning open source software》

介紹:機(jī)器學(xué)習(xí)開源軟件,收錄了各種機(jī)器學(xué)習(xí)的各種編程語言學(xué)術(shù)與商業(yè)的開源軟件.與此類似的還有很多例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software,?LIBSVM -- A Library for Support Vector Machines,?Weka 3: Data Mining Software in Java,?scikit-learn:Machine Learning in Python,?Natural Language Toolkit:NLTK,?MAchine Learning for LanguagE Toolkit,?Data Mining - Fruitful and Fun,?Open Source Computer Vision Library

  • 《機(jī)器學(xué)習(xí)入門者學(xué)習(xí)指南》

介紹:作者是計算機(jī)研二(寫文章的時候,現(xiàn)在是2015年了應(yīng)該快要畢業(yè)了),專業(yè)方向自然語言處理.這是一點他的經(jīng)驗之談.對于入門的朋友或許會有幫助

  • 《A Tour of Machine Learning Algorithms》

介紹:這是一篇關(guān)于機(jī)器學(xué)習(xí)算法分類的文章,非常好

  • 《2014年的《機(jī)器學(xué)習(xí)日報》大合集》

介紹:機(jī)器學(xué)習(xí)日報里面推薦很多內(nèi)容,在這里有一部分的優(yōu)秀內(nèi)容就是來自機(jī)器學(xué)習(xí)日報.

  • 《 Image classification with deep learning常用模型》

介紹:這是一篇關(guān)于圖像分類在深度學(xué)習(xí)中的文章

  • 《自動語音識別:深度學(xué)習(xí)方法》

介紹:作者與Bengio的兄弟Samy 09年合編《自動語音識別:核方法》 3)李開復(fù)1989年《自動語音識別》專著,其博導(dǎo)、94年圖靈獎得主Raj Reddy作序

  • 《NLP中的中文分詞技術(shù)》

介紹: 作者是360電商技術(shù)組成員,這是一篇NLP在中文分詞中的應(yīng)用

  • 《Using convolutional neural nets to detect facial keypoints tutorial》

介紹: 使用deep learning的人臉關(guān)鍵點檢測,此外還有一篇AWS部署教程

  • 《書籍推薦:Advanced Structured Prediction》

介紹: 由Sebastian Nowozin等人編纂MIT出版的新書《Advanced Structured Prediction》http://t.cn/RZxipKG?,匯集了結(jié)構(gòu)化預(yù)測領(lǐng)域諸多牛文,涉及CV、NLP等領(lǐng)域,值得一讀。網(wǎng)上公開的幾章草稿:一,二,三,四,五

  • 《An Introduction to Matrix Concentration Inequalities》

介紹: Tropp把數(shù)學(xué)家用高深裝逼的數(shù)學(xué)語言寫的矩陣概率不等式用初等的方法寫出來,是非常好的手冊,領(lǐng)域內(nèi)的paper各種證明都在用里面的結(jié)果。雖說是初等的,但還是非常的難

  • 《The free big data sources you should know》

介紹: 不容錯過的免費大數(shù)據(jù)集,有些已經(jīng)是耳熟能詳,有些可能還是第一次聽說,內(nèi)容跨越文本、數(shù)據(jù)、多媒體等,讓他們伴你開始數(shù)據(jù)科學(xué)之旅吧,具體包 括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk等

  • 《A Brief Overview of Deep Learning》

介紹: 谷歌科學(xué)家、Hinton親傳弟子Ilya Sutskever的深度學(xué)習(xí)綜述及實際建議

  • 《A Deep Dive into Recurrent Neural Nets》

介紹: 非常好的討論遞歸神經(jīng)網(wǎng)絡(luò)的文章,覆蓋了RNN的概念、原理、訓(xùn)練及優(yōu)化等各個方面內(nèi)容,強(qiáng)烈推薦!本文作者Nikhil Buduma還有一篇Deep Learning in a Nutshell值得推薦

  • 《機(jī)器學(xué)習(xí):學(xué)習(xí)資源》

介紹:里面融合了很多的資源,例如競賽,在線課程,demo,數(shù)據(jù)整合等。有分類

  • 《Statistical foundations of machine learning》

介紹:《機(jī)器學(xué)習(xí)的統(tǒng)計基礎(chǔ)》在線版,該手冊希望在理論與實踐之間找到平衡點,各主要內(nèi)容都伴有實際例子及數(shù)據(jù),書中的例子程序都是用R語言編寫的。

  • 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》

介紹:IVAN VASILEV寫的深度學(xué)習(xí)導(dǎo)引:從淺層感知機(jī)到深度網(wǎng)絡(luò)。高可讀

  • 《Research priorities for robust and beneficial artificial intelligence》

介紹:魯棒及有益的人工智能優(yōu)先研究計劃:一封公開信,目前已經(jīng)有Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk等人簽署The Future of Life Institute (FLI). 這封信的背景是最近霍金和Elon Musk提醒人們注意AI的潛在威脅。公開信的內(nèi)容是AI科學(xué)家們站在造福社會的角度,展望人工智能的未來發(fā)展方向,提出開發(fā)AI系統(tǒng)的 Verification,Validity, Security, Control四點要求,以及需要注意的社會問題。畢竟當(dāng)前AI在經(jīng)濟(jì)領(lǐng)域,法律,以及道德領(lǐng)域相關(guān)研究較少。其實還有一部美劇《疑犯追蹤》,介紹了AI的演進(jìn)從一開始的自我學(xué)習(xí),過濾,圖像識別,語音識別等判斷危險,到第四季的時候出現(xiàn)了機(jī)器通過學(xué)習(xí)成長之后想控制世界的狀態(tài)。說到這里推薦收看。

  • 《metacademy》

介紹:里面根據(jù)詞條提供了許多資源,還有相關(guān)知識結(jié)構(gòu),路線圖,用時長短等。號稱是”機(jī)器學(xué)習(xí)“搜索引擎

  • 《FAIR open sources deep-learning modules for Torch》

介紹:Facebook人工智能研究院(FAIR)開源了一系列軟件庫,以幫助開發(fā)者建立更大、更快的深度學(xué)習(xí)模型。開放的軟件庫在 Facebook 被稱作模塊。用它們替代機(jī)器學(xué)習(xí)領(lǐng)域常用的開發(fā)環(huán)境 Torch 中的默認(rèn)模塊,可以在更短的時間內(nèi)訓(xùn)練更大規(guī)模的神經(jīng)網(wǎng)絡(luò)模型。

  • 《淺析人臉檢測之Haar分類器方法》

介紹:本文雖然是寫于2012年,但是這篇文章完全是作者的經(jīng)驗之作。

  • 《如何成為一位數(shù)據(jù)科學(xué)家》

介紹:本文是對《機(jī)器學(xué)習(xí)實戰(zhàn)》作者Peter Harrington做的一個訪談。包含了書中部分的疑問解答和一點個人學(xué)習(xí)建議

  • 《Deep learning from the bottom up》

介紹:非常好的深度學(xué)習(xí)概述,對幾種流行的深度學(xué)習(xí)模型都進(jìn)行了介紹和討論

  • 《Hands-On Data Science with R Text Mining》

介紹:主要是講述了利用R語言進(jìn)行數(shù)據(jù)挖掘

  • 《Understanding Convolutions》

介紹:幫你理解卷積神經(jīng)網(wǎng)絡(luò),講解很清晰,此外還有兩篇Conv Nets: A Modular Perspective,Groups & Group Convolutions. 作者的其他的關(guān)于神經(jīng)網(wǎng)絡(luò)文章也很棒

  • 《Introduction to Deep Learning Algorithms》

介紹:Deep Learning算法介紹,里面介紹了06年3篇讓deep learning崛起的論文

  • 《Learning Deep Architectures for AI》

介紹:一本學(xué)習(xí)人工智能的書籍,作者是Yoshua Bengio,相關(guān)國內(nèi)報道

  • 《Geoffrey E. Hinton個人主頁》

介紹:Geoffrey Hinton是Deep Learning的大牛,他的主頁放了一些介紹性文章和課件值得學(xué)習(xí)

  • 《PROBABILITY THEORY: THE LOGIC OF SCIENCE》

介紹:概率論:數(shù)理邏輯書籍

  • 《H2O》

介紹:一個用來快速的統(tǒng)計,機(jī)器學(xué)習(xí)并且對于數(shù)據(jù)量大的數(shù)學(xué)庫

  • 《ICLR 2015會議的arXiv稿件合集》

介紹:在這里你可以看到最近深度學(xué)習(xí)有什么新動向。

  • 《Introduction to Information Retrieval》

介紹:此書在信息檢索領(lǐng)域家喻戶曉, 除提供該書的免費電子版外,還提供一個IR資源列表?,收錄了信息檢索、網(wǎng)絡(luò)信息檢索、搜索引擎實現(xiàn)等方面相關(guān)的圖書、研究中心、相關(guān)課程、子領(lǐng)域、會議、期刊等等,堪稱全集,值得收藏

  • 《Information Geometry and its Applications to Machine Learning》

介紹:信息幾何學(xué)及其在機(jī)器學(xué)習(xí)中的應(yīng)用

  • 《Legal Analytics – Introduction to the Course》

介紹:課程《法律分析》介紹幻燈片。用機(jī)器學(xué)習(xí)解決法律相關(guān)分析和預(yù)測問題,相關(guān)的法律應(yīng)用包括預(yù)測編碼、早期案例評估、案件整體情況的預(yù)測,定價和工作人員預(yù)測,司法行為預(yù)測等。法律領(lǐng)域大家可能都比較陌生,不妨了解下。

  • 《文本上的算法》

介紹: 文中提到了最優(yōu),模型,最大熵等等理論,此外還有應(yīng)用篇。推薦系統(tǒng)可以說是一本不錯的閱讀稿,關(guān)于模型還推薦一篇Generative Model 與 Discriminative Model

  • 《NeuralTalk》

介紹: NeuralTalk is a Python+numpy project for learning Multimodal Recurrent Neural Networks that describe images with sentences.NeuralTalk是一個Python的從圖像生成自然語言描述的工具。它實現(xiàn)了Google (Vinyals等,卷積神經(jīng)網(wǎng)絡(luò)CNN + 長短期記憶LSTM) 和斯坦福 (Karpathy and Fei-Fei, CNN + 遞歸神經(jīng)網(wǎng)絡(luò)RNN)的算法。NeuralTalk自帶了一個訓(xùn)練好的動物模型,你可以拿獅子大象的照片來試試看

  • 《Deep Learning on Hadoop 2.0》

介紹:本文主要介紹了在Hadoop2.0上使用深度學(xué)習(xí),文章來自paypal

  • 《Practical recommendations for gradient-based training of deep architectures》

介紹:用基于梯度下降的方法訓(xùn)練深度框架的實踐推薦指導(dǎo),作者是Yoshua Bengio?.感謝@xuewei4d 推薦

  • 《Machine Learning With Statistical And Causal Methods》

介紹: 用統(tǒng)計和因果方法做機(jī)器學(xué)習(xí)(視頻報告)

  • 《Machine Learning Course 180’》

介紹: 一個講機(jī)器學(xué)習(xí)的Youtube視頻教程。160集。系統(tǒng)程度跟書可比擬。

  • 《回歸(regression)、梯度下降(gradient descent)》

介紹: 機(jī)器學(xué)習(xí)中的數(shù)學(xué),作者的研究方向是機(jī)器學(xué)習(xí),并行計算如果你還想了解一點其他的可以看看他博客的其他文章

  • 《美團(tuán)推薦算法實踐》

介紹: 美團(tuán)推薦算法實踐,從框架,應(yīng)用,策略,查詢等分析

  • 《Deep Learning for Answer Sentence Selection》

介紹: 深度學(xué)習(xí)用于問答系統(tǒng)答案句的選取

  • 《Learning Semantic Representations Using Convolutional Neural Networks for Web Search 》

介紹: CNN用于WEB搜索,深度學(xué)習(xí)在文本計算中的應(yīng)用

  • 《Awesome Public Datasets》

介紹: Awesome系列中的公開數(shù)據(jù)集

  • 《Search Engine & Community》

介紹: 一個學(xué)術(shù)搜索引擎

  • 《spaCy》

介紹: 用Python和Cython寫的工業(yè)級自然語言處理庫,號稱是速度最快的NLP庫,快的原因一是用Cython寫的,二是用了個很巧妙的hash技術(shù),加速系統(tǒng)的瓶頸,NLP中稀松特征的存取

  • 《Collaborative Filtering with Spark》

介紹:?Fields是個數(shù)學(xué)研究中心,上面的這份ppt是來自Fields舉辦的活動中Russ Salakhutdinov帶來的《大規(guī)模機(jī)器學(xué)習(xí)》分享

  • 《Topic modeling 的經(jīng)典論文》

介紹: Topic modeling 的經(jīng)典論文,標(biāo)注了關(guān)鍵點

  • 《Move Evaluation in Go Using Deep Convolutional Neural Networks》

介紹: 多倫多大學(xué)與Google合作的新論文,深度學(xué)習(xí)也可以用來下圍棋,據(jù)說能達(dá)到六段水平

  • 《機(jī)器學(xué)習(xí)周刊第二期》

介紹: 新聞,paper,課程,book,system,CES,Roboot,此外還推薦一個深度學(xué)習(xí)入門與綜述資料

  • 《Learning more like a human: 18 free eBooks on Machine Learning》

介紹: 18 free eBooks on Machine Learning

  • 《Recommend :Hang Li Home》

介紹:Chief scientist of Noah's Ark Lab of Huawei Technologies.He worked at the Research Laboratories of NEC Corporation during 1990 and 2001 and Microsoft Research Asia during 2001 and 2012.Paper

  • 《DEEPLEARNING.UNIVERSITY – AN ANNOTATED DEEP LEARNING BIBLIOGRAPHY》

介紹: DEEPLEARNING.UNIVERSITY的論文庫已經(jīng)收錄了963篇經(jīng)過分類的深度學(xué)習(xí)論文了,很多經(jīng)典論文都已經(jīng)收錄

  • 《MLMU.cz - Radim ?eh??ek - Word2vec & friends (7.1.2015)》

介紹: Radim ?eh??ek(Gensim開發(fā)者)在一次機(jī)器學(xué)習(xí)聚會上的報告,關(guān)于word2vec及其優(yōu)化、應(yīng)用和擴(kuò)展,很實用.國內(nèi)網(wǎng)盤

  • 《Introducing streaming k-means in Spark 1.2》

介紹:很多公司都用機(jī)器學(xué)習(xí)來解決問題,提高用戶體驗。那么怎么可以讓機(jī)器學(xué)習(xí)更實時和有效呢?Spark MLlib 1.2里面的Streaming K-means,由斑馬魚腦神經(jīng)研究的Jeremy Freeman腦神經(jīng)科學(xué)家編寫,最初是為了實時處理他們每半小時1TB的研究數(shù)據(jù),現(xiàn)在發(fā)布給大家用了。

  • 《LDA入門與Java實現(xiàn)》

介紹: 這是一篇面向工程師的LDA入門筆記,并且提供一份開箱即用Java實現(xiàn)。本文只記錄基本概念與原理,并不涉及公式推導(dǎo)。文中的LDA實現(xiàn)核心部分采用了arbylon的LdaGibbsSampler并力所能及地注解了,在搜狗分類語料庫上測試良好,開源在GitHub上。

  • 《AMiner - Open Science Platform》

介紹: AMiner是一個學(xué)術(shù)搜索引擎,從學(xué)術(shù)網(wǎng)絡(luò)中挖掘深度知識、面向科技大數(shù)據(jù)的挖掘。收集近4000萬作者信息、8000萬論文信息、1億多引用關(guān)系、鏈接近8百萬知識點;支持專家搜索、機(jī)構(gòu)排名、科研成果評價、會議排名。

  • 《What are some interesting Word2Vec results?》

介紹: Quora上的主題,討論Word2Vec的有趣應(yīng)用,Omer Levy提到了他在CoNLL2014最佳論文里的分析結(jié)果和新方法,Daniel Hammack給出了找特異詞的小應(yīng)用并提供了(Python)代碼

  • 《機(jī)器學(xué)習(xí)公開課匯總》

介紹: 機(jī)器學(xué)習(xí)公開課匯總,雖然里面的有些課程已經(jīng)歸檔過了,但是還有個別的信息沒有。感謝課程圖譜的小編

  • 《A First Course in Linear Algebra》

介紹: 【A First Course in Linear Algebra】Robert Beezer 有答案 有移動版、打印版 使用GNU自由文檔協(xié)議 引用了杰弗遜1813年的信

  • 《libfacedetection》

介紹:libfacedetection是深圳大學(xué)開源的一個人臉圖像識別庫。包含正面和多視角人臉檢測兩個算法.優(yōu)點:速度快(OpenCV haar+adaboost的2-3倍), 準(zhǔn)確度高 (FDDB非公開類評測排名第二),能估計人臉角度。

  • 《Inverting a Steady-State》

介紹:WSDM2015最佳論文 把馬爾可夫鏈理論用在了圖分析上面,比一般的propagation model更加深刻一些。通過全局的平穩(wěn)分布去求解每個節(jié)點影響系數(shù)模型。假設(shè)合理(轉(zhuǎn)移受到相鄰的影響系數(shù)影響)??梢杂脕矸辞竺總€節(jié)點的影響系數(shù)

  • 《機(jī)器學(xué)習(xí)入門書單》

介紹:機(jī)器學(xué)習(xí)入門書籍,具體介紹

  • 《The Trouble with SVMs》

介紹: 非常棒的強(qiáng)調(diào)特征選擇對分類器重要性的文章。情感分類中,根據(jù)互信息對復(fù)雜高維特征降維再使用樸素貝葉斯分類器,取得了比SVM更理想的效果,訓(xùn)練和分類時間也大大降低——更重要的是,不必花大量時間在學(xué)習(xí)和優(yōu)化SVM上——特征也一樣no free lunch

  • 《Rise of the Machines》

介紹:CMU的統(tǒng)計系和計算機(jī)系知名教授Larry Wasserman 在《機(jī)器崛起》,對比了統(tǒng)計和機(jī)器學(xué)習(xí)的差異

  • 《實例詳解機(jī)器學(xué)習(xí)如何解決問題》

介紹:隨著大數(shù)據(jù)時代的到來,機(jī)器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界,機(jī)器學(xué)習(xí)都是一個炙手可熱的方向,但是學(xué)術(shù)界 和工業(yè)界對機(jī)器學(xué)習(xí)的研究各有側(cè)重,學(xué)術(shù)界側(cè)重于對機(jī)器學(xué)習(xí)理論的研究,工業(yè)界側(cè)重于如何用機(jī)器學(xué)習(xí)來解決實際問題。這篇文章是美團(tuán)的實際環(huán)境中的實戰(zhàn)篇

  • 《Gaussian Processes for Machine Learning》

介紹:面向機(jī)器學(xué)習(xí)的高斯過程,章節(jié)概要:回歸、分類、協(xié)方差函數(shù)、模型選擇與超參優(yōu)化、高斯模型與其他模型關(guān)系、大數(shù)據(jù)集的逼近方法等,微盤下載

  • 《FuzzyWuzzy: Fuzzy String Matching in Python》

介紹:Python下的文本模糊匹配庫,老庫新推,可計算串間ratio(簡單相似系數(shù))、partial_ratio(局部相似系數(shù))、token_sort_ratio(詞排序相似系數(shù))、token_set_ratio(詞集合相似系數(shù))等?github

  • 《Blocks》

介紹:Blocks是基于Theano的神經(jīng)網(wǎng)絡(luò)搭建框架,集成相關(guān)函數(shù)、管道和算法,幫你更快地創(chuàng)建和管理NN模塊.

  • 《Introduction to Machine Learning》

介紹:機(jī)器學(xué)習(xí)大神Alex Smola在CMU新一期的機(jī)器學(xué)習(xí)入門課程”Introduction to Machine Learning“近期剛剛開課,課程4K高清視頻同步到Y(jié)outube上,目前剛剛更新到 2.4 Exponential Families,課程視頻playlist, 感興趣的同學(xué)可以關(guān)注,非常適合入門.

  • 《Collaborative Feature Learning from Social Media》

介紹:用社交用戶行為學(xué)習(xí)圖片的協(xié)同特征,可更好地表達(dá)圖片內(nèi)容相似性。由于不依賴于人工標(biāo)簽(標(biāo)注),可用于大規(guī)模圖片處理,難在用戶行為數(shù)據(jù)的獲取和清洗;利用社會化特征的思路值得借鑒.

  • 《Introducing practical and robust anomaly detection in a time series》

介紹:Twitter技術(shù)團(tuán)隊對前段時間開源的時間序列異常檢測算法(S-H-ESD)R包的介紹,其中對異常的定義和分析很值得參考,文中也提到——異常是強(qiáng)針對性的,某個領(lǐng)域開發(fā)的異常檢測在其他領(lǐng)域直接用可不行.

  • 《Empower Your Team to Deal with Data-Quality Issues》

介紹:聚焦數(shù)據(jù)質(zhì)量問題的應(yīng)對,數(shù)據(jù)質(zhì)量對各種規(guī)模企業(yè)的性能和效率都至關(guān)重要,文中總結(jié)出(不限于)22種典型數(shù)據(jù)質(zhì)量問題顯現(xiàn)的信號,以及典型的數(shù)據(jù)質(zhì)量解決方案(清洗、去重、統(tǒng)一、匹配、權(quán)限清理等)

  • 《中文分詞入門之資源》

介紹:中文分詞入門之資源.

  • 《Deep Learning Summit, San Francisco, 2015》

介紹:15年舊金山深度學(xué)習(xí)峰會視頻集萃,國內(nèi)云盤

  • 《Introduction to Conditional Random Fields》

介紹:很好的條件隨機(jī)場(CRF)介紹文章,作者的學(xué)習(xí)筆記

  • 《A Fast and Accurate Dependency Parser using Neural Networks》

介紹: 來自Stanford,用神經(jīng)網(wǎng)絡(luò)實現(xiàn)快速準(zhǔn)確的依存關(guān)系解析器

  • 《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning》

介紹:做深度學(xué)習(xí)如何選擇GPU的建議

  • 《Sparse Linear Models》

介紹: Stanford的Trevor Hastie教授在H2O.ai Meet-Up上的報告,講稀疏線性模型——面向“寬數(shù)據(jù)”(特征維數(shù)超過樣本數(shù))的線性模型,13年同主題報告?、講義.

  • 《Awesome Computer Vision》

介紹: 分類整理的機(jī)器視覺相關(guān)資源列表,秉承Awesome系列風(fēng)格,有質(zhì)有量!作者的更新頻率也很頻繁

  • 《Adam Szeidl》

介紹: social networks course

  • 《Building and deploying large-scale machine learning pipelines》

介紹: 大規(guī)模機(jī)器學(xué)習(xí)流程的構(gòu)建與部署.

  • 《人臉識別開發(fā)包》

介紹: 人臉識別二次開發(fā)包,免費,可商用,有演示、范例、說明書.

  • 《Understanding Natural Language with Deep Neural Networks Using Torch》

介紹: 采用Torch用深度學(xué)習(xí)網(wǎng)絡(luò)理解NLP,來自Facebook 人工智能的文章.

  • 《The NLP Engine: A Universal Turing Machine for NLP》

介紹: 來自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章,作者用Shannon Entropy來刻畫NLP中各項任務(wù)的難度.

  • 《TThe Probabilistic Relevance Framework: BM25 and Beyond》

介紹: 信息檢索排序模型BM25(Besting Matching)。1)從經(jīng)典概率模型演變而來 2)捕捉了向量空間模型中三個影響索引項權(quán)重的因子:IDF逆文檔頻率;TF索引項頻率;文檔長度歸一化。3)并且含有集成學(xué)習(xí)的思想:組合了BM11和 BM15兩個模型。4)作者是BM25的提出者和Okapi實現(xiàn)者Robertson.

  • 《Introduction to ARMA Time Series Models – simplified》

介紹: 自回歸滑動平均(ARMA)時間序列的簡單介紹,ARMA是研究時間序列的重要方法,由自回歸模型(AR模型)與滑動平均模型(MA模型)為基礎(chǔ)“混合”構(gòu)成.

  • 《Encoding Source Language with Convolutional Neural Network for Machine Translation》

介紹: 把來自target的attention signal加入source encoding CNN的輸入,得到了比BBN的模型好的多neural network joint model

  • 《Spices form the basis of food pairing in Indian cuisine》

介紹: 揭開印度菜的美味秘訣——通過對大量食譜原料關(guān)系的挖掘,發(fā)現(xiàn)印度菜美味的原因之一是其中的味道互相沖突,很有趣的文本挖掘研究

  • 《HMM相關(guān)文章索引》

介紹: HMM相關(guān)文章

  • 《Zipf's and Heap's law》

介紹: 1)詞頻與其降序排序的關(guān)系,最著名的是語言學(xué)家齊夫(Zipf,1902-1950)1949年提出的Zipf‘s law,即二者成反比關(guān)系. 曼德勃羅(Mandelbrot,1924- 2010)引入?yún)?shù)修正了對甚高頻和甚低頻詞的刻畫 2)Heaps' law: 詞匯表與語料規(guī)模的平方根(這是一個參數(shù),英語0.4-0.6)成正比

  • 《I am Jürgen Schmidhuber, AMA》

介紹: Jürgen Schmidhuber在Reddit上的AMA(Ask Me Anything)主題,有不少RNN和AI、ML的干貨內(nèi)容,關(guān)于開源&思想&方法&建議……耐心閱讀,相信你也會受益匪淺.

  • 《學(xué)術(shù)種子網(wǎng)站:AcademicTorrents》

介紹: 成G上T的學(xué)術(shù)數(shù)據(jù),HN近期熱議話題,主題涉及機(jī)器學(xué)習(xí)、NLP、SNA等。下載最簡單的方法,通過BT軟件,RSS訂閱各集合即可

  • 《機(jī)器學(xué)習(xí)交互速查表》

介紹: Scikit-Learn官網(wǎng)提供,在原有的Cheat Sheet基礎(chǔ)上加上了Scikit-Learn相關(guān)文檔的鏈接,方便瀏覽

  • 《A Full Hardware Guide to Deep Learning》

介紹: 深度學(xué)習(xí)的全面硬件指南,從GPU到RAM、CPU、SSD、PCIe

  • 《行人檢測(Pedestrian Detection)資源》

介紹:Pedestrian Detection paper & data

  • 《A specialized face-processing network consistent with the representational geometry of monkey face patches》

介紹: 【神經(jīng)科學(xué)碰撞人工智能】在臉部識別上你我都是專家,即使細(xì)微的差別也能辨認(rèn)。研究已證明人類和靈長類動物在面部加工上不同于其他物種,人類使用梭狀回面 孔區(qū)(FFA)。Khaligh-Razavi等通過計算機(jī)模擬出人臉識別的FFA活動,堪稱神經(jīng)科學(xué)與人工智能的完美結(jié)合。

  • 《Neural Net in C++ Tutorial》

介紹: 神經(jīng)網(wǎng)絡(luò)C++教程,本文介紹了用可調(diào)節(jié)梯度下降和可調(diào)節(jié)動量法設(shè)計和編碼經(jīng)典BP神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)經(jīng)過訓(xùn)練可以做出驚人和美妙的東西出來。此外作者博客的其他文章也很不錯。

  • 《How to Choose a Neural Network》

介紹:deeplearning4j官網(wǎng)提供的實際應(yīng)用場景NN選擇參考表,列舉了一些典型問題建議使用的神經(jīng)網(wǎng)絡(luò)

  • 《Deep Learning (Python, C/C++, Java, Scala, Go)》

介紹:一個深度學(xué)習(xí)項目,提供了Python, C/C++, Java, Scala, Go多個版本的代碼

  • 《Deep Learning Tutorials》

介紹:深度學(xué)習(xí)教程

  • 《自然語言處理的發(fā)展趨勢——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授》

介紹:自然語言處理的發(fā)展趨勢——訪卡內(nèi)基梅隆大學(xué)愛德華·霍威教授.

  • 《FaceNet: A Unified Embedding for Face Recognition and Clustering》

介紹:Google對Facebook DeepFace的有力回?fù)簟?FaceNet,在LFW(Labeled Faces in the Wild)上達(dá)到99.63%準(zhǔn)確率(新紀(jì)錄),FaceNet embeddings可用于人臉識別、鑒別和聚類.

  • 《MLlib中的Random Forests和Boosting》

介紹:本文來自Databricks公司網(wǎng)站的一篇博客文章,由Joseph Bradley和Manish Amde撰寫,文章主要介紹了Random Forests和Gradient-Boosted Trees(GBTs)算法和他們在MLlib中的分布式實現(xiàn),以及展示一些簡單的例子并建議該從何處上手.中文版.

  • 《Sum-Product Networks(SPN) 》

介紹:華盛頓大學(xué)Pedro Domingos團(tuán)隊的DNN,提供論文和實現(xiàn)代碼.

  • 《Neural Network Dependency Parser》

介紹:基于神經(jīng)網(wǎng)絡(luò)的自然語言依存關(guān)系解析器(已集成至Stanford CoreNLP),特點是超快、準(zhǔn)確,目前可處理中英文語料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》?思路實現(xiàn).

  • 《神經(jīng)網(wǎng)絡(luò)語言模型》

介紹:本文根據(jù)神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程,詳細(xì)講解神經(jīng)網(wǎng)絡(luò)語言模型在各個階段的形式,其中的模型包含NNLM[Bengio,2003]、 Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要變形,總結(jié)的特別好.

  • 《Classifying Spam Emails using Text and Readability Features》

介紹:經(jīng)典問題的新研究:利用文本和可讀性特征分類垃圾郵件。

  • 《BCI Challenge @ NER 2015》

介紹:Kaggle腦控計算機(jī)交互(BCI)競賽優(yōu)勝方案源碼及文檔,包括完整的數(shù)據(jù)處理流程,是學(xué)習(xí)Python數(shù)據(jù)處理和Kaggle經(jīng)典參賽框架的絕佳實例

  • 《IPOL Journal · Image Processing On Line》

介紹:IPOL(在線圖像處理)是圖像處理和圖像分析的研究期刊,每篇文章都包含一個算法及相應(yīng)的代碼、Demo和實驗文檔。文本和源碼是經(jīng)過了同行評審的。IPOL是開放的科學(xué)和可重復(fù)的研究期刊。我一直想做點類似的工作,拉近產(chǎn)品和技術(shù)之間的距離.

  • 《Machine learning classification over encrypted data》

介紹:出自MIT,研究加密數(shù)據(jù)高效分類問題.

  • 《purine2》

介紹:新加坡LV實驗室的神經(jīng)網(wǎng)絡(luò)并行框架Purine: A bi-graph based deep learning framework,支持構(gòu)建各種并行的架構(gòu),在多機(jī)多卡,同步更新參數(shù)的情況下基本達(dá)到線性加速。12塊Titan 20小時可以完成Googlenet的訓(xùn)練。

  • 《Machine Learning Resources》

介紹:這是一個機(jī)器學(xué)習(xí)資源庫,雖然比較少.但蚊子再小也是肉.有突出部分.此外還有一個由zheng Rui整理的機(jī)器學(xué)習(xí)資源.

  • 《Hands-on with machine learning》

介紹:Chase Davis在NICAR15上的主題報告材料,用Scikit-Learn做監(jiān)督學(xué)習(xí)的入門例子.

  • 《The Natural Language Processing Dictionary》

介紹:這是一本自然語言處理的詞典,從1998年開始到目前積累了成千上萬的專業(yè)詞語解釋,如果你是一位剛?cè)腴T的朋友.可以借這本詞典讓自己成長更快.

  • 《PageRank Approach to Ranking National Football Teams》

介紹:通過分析1930年至今的比賽數(shù)據(jù),用PageRank計算世界杯參賽球隊排行榜.

  • 《R Tutorial》

介紹:R語言教程,此外還推薦一個R語言教程An Introduction to R.

  • 《Fast unfolding of communities in large networks》

介紹:經(jīng)典老文,復(fù)雜網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)的高效算法,Gephi中的Community detection即基于此.

  • 《NUML》

介紹: 一個面向 .net 的開源機(jī)器學(xué)習(xí)庫,github地址

  • 《synaptic.Js》

介紹: 支持node.js的JS神經(jīng)網(wǎng)絡(luò)庫,可在客戶端瀏覽器中運行,支持LSTM等?github地址

  • 《Machine learning for package users with R (1): Decision Tree》

介紹: 決策樹

  • 《Deep Learning, The Curse of Dimensionality, and Autoencoders》

介紹: 討論深度學(xué)習(xí)自動編碼器如何有效應(yīng)對維數(shù)災(zāi)難,國內(nèi)翻譯

  • 《Advanced Optimization and Randomized Methods》

介紹: CMU的優(yōu)化與隨機(jī)方法課程,由A. Smola和S. Sra主講,優(yōu)化理論是機(jī)器學(xué)習(xí)的基石,值得深入學(xué)習(xí)?國內(nèi)云(視頻)

  • 《CS231n: Convolutional Neural Networks for Visual Recognition》

介紹: "面向視覺識別的CNN"課程設(shè)計報告集錦.近百篇,內(nèi)容涉及圖像識別應(yīng)用的各個方面

  • 《Topic modeling with LDA: MLlib meets GraphX》

介紹:用Spark的MLlib+GraphX做大規(guī)模LDA主題抽取.

  • 《Deep Learning for Multi-label Classification》

介紹: 基于深度學(xué)習(xí)的多標(biāo)簽分類,用基于RBM的DBN解決多標(biāo)簽分類(特征)問題

  • 《Google DeepMind publications》

介紹: DeepMind論文集錦

  • 《kaldi》

介紹: 一個開源語音識別工具包,它目前托管在sourceforge上面

  • 《Data Journalism Handbook》

介紹: 免費電子書《數(shù)據(jù)新聞手冊》, 國內(nèi)有熱心的朋友翻譯了中文版,大家也可以在線閱讀

  • 《Data Mining Problems in Retail》

介紹: 零售領(lǐng)域的數(shù)據(jù)挖掘文章.

  • 《Understanding Convolution in Deep Learning》

介紹: 深度學(xué)習(xí)卷積概念詳解,深入淺出.

  • 《pandas: powerful Python data analysis toolkit》

介紹: 非常強(qiáng)大的Python的數(shù)據(jù)分析工具包.

  • 《Text Analytics 2015》

介紹: 2015文本分析(商業(yè))應(yīng)用綜述.

  • 《Deep Learning libraries and ?rst experiments with Theano》

介紹: 深度學(xué)習(xí)框架、庫調(diào)研及Theano的初步測試體會報告.

  • 《DEEP learning》

介紹: MIT的Yoshua Bengio等人講深度學(xué)習(xí)的新書,還未定稿,線上提供Draft chapters收集反饋,超贊!強(qiáng)烈推薦.

  • 《simplebayes》

介紹: Python下開源可持久化樸素貝葉斯分類庫.

  • 《Paracel》

介紹:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.

  • 《HanLP:Han Language processing》

介紹: 開源漢語言處理包.

  • 《Simple Neural Network implementation in Ruby》

介紹: 使用Ruby實現(xiàn)簡單的神經(jīng)網(wǎng)絡(luò)例子.

  • 《Hacker's guide to Neural Networks》

介紹:神經(jīng)網(wǎng)絡(luò)黑客入門.

  • 《The Open-Source Data Science Masters》

介紹:好多數(shù)據(jù)科學(xué)家名人推薦,還有資料.

  • 《Text Understanding from Scratch》

介紹:實現(xiàn)項目已經(jīng)開源在github上面Crepe

  • 《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》

介紹:作者發(fā)現(xiàn),經(jīng)過調(diào)參,傳統(tǒng)的方法也能和word2vec取得差不多的效果。另外,無論作者怎么試,GloVe都比不過word2vec.

  • 《CS224d: Deep Learning for Natural Language Processing》

介紹:Stanford深度學(xué)習(xí)與自然語言處理課程,Richard Socher主講.

  • 《Math Essentials in Machine Learning》

介紹:機(jī)器學(xué)習(xí)中的重要數(shù)學(xué)概念.

  • 《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》

介紹:用于改進(jìn)語義表示的樹型LSTM遞歸神經(jīng)網(wǎng)絡(luò),句子級相關(guān)性判斷和情感分類效果很好.實現(xiàn)代碼.

來自: https://github.com/ty4z2008/Qix/blob/master/dl.md

總結(jié)

以上是生活随笔為你收集整理的机器学习资料汇总的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。