日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

超级干货 :手把手教你学习R语言(附资源链接)

發(fā)布時間:2023/12/20 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 超级干货 :手把手教你学习R语言(附资源链接) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者:NSS;翻譯:楊金鴻;校對:韓海疇,林亦霖;


本文約3000字,建議閱讀7分鐘。
本文為帶大家了解R語言以及分段式的步驟教程!


人們學(xué)習(xí)R語言時普遍存在缺乏系統(tǒng)學(xué)習(xí)方法的問題。學(xué)習(xí)者不知道從哪開始,如何進行,選擇什么學(xué)習(xí)資源。雖然網(wǎng)絡(luò)上有許多不錯的免費學(xué)習(xí)資源,然而它們多過了頭,反而會讓人挑花了眼。


為了構(gòu)建R語言學(xué)習(xí)方法,我們在Vidhya和DataCamp中選一組綜合資源,幫您從頭學(xué)習(xí)R語言。這套學(xué)習(xí)方法對于數(shù)據(jù)科學(xué)或R語言的初學(xué)者會很有用;如果讀者是R語言的老用戶,則會由本文了解這門語言的部分最新成果。


R語言學(xué)習(xí)方法會幫助您快速、高效學(xué)習(xí)R語言。


前言


在開始學(xué)習(xí)之前,第一個要回答的問題是:為什么要用R語言?或者R語言為何如此有用?


R語言是一門快速發(fā)展的開源軟件,是SAS、STATA和SPSS這類商業(yè)軟件的競爭對手。就業(yè)市場對R語言的需求正在迅速上升,微軟等公司也同時承諾將致力讓R語言成為數(shù)據(jù)科學(xué)通用語言。


看看由Revolution Analytics制作的90秒視頻(https://www.youtube.com/watch?v=VlJnNSeO1uQ),您就知道R語言的用處。順便說下,微軟剛剛收購了Revolution Analytics。


步驟一:配置計算機環(huán)境


建立R語言學(xué)習(xí)環(huán)境最簡單方法是通過綜合R語言歸檔網(wǎng)絡(luò)(CRAN)下載(https://cran.r-project.org/)到您的本地計算機上。可以選擇Linux、Mac和Windows對應(yīng)二進制文件下載。


您可能會考慮使用R語言自帶的控制臺,但我們建議您安裝R語言集成開發(fā)環(huán)境(IDE)。RStudio(https://www.rstudio.com/)是最有名的IDE,它能讓R語言編碼更容易、更快,還能讓您輸入多行代碼、處理圖形、安裝和維護程序,有效引導(dǎo)您的編程環(huán)境。RStudio此外可以選用基于eclipse的Architect(http://www.openanalytics.eu/architect)。如果需要安裝圖形用戶界面GUI,請選擇R-commander(http://www.rcommander.com/)或Deducer(http://www.deducer.org/pmwiki/index.php?n=Main.WindowsInstallation)。


課后作業(yè)


  • 安裝R和RStudio。


  • 安裝Rcmdr、rattle和Deducer程序包。以及推薦或依賴的程序包,包括GUI。


  • 使用庫命令加載安裝程序,并打開GUI。


步驟二:R語言基礎(chǔ)學(xué)習(xí)


您應(yīng)該首先了解語言、庫和數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)知識。


如果您更傾向于在線交流方式學(xué)習(xí)R語法,DataCamp(https://www.datacamp.com/courses/free-introduction-to-r)提供的免費在線R教程是很好的資源。還可以選擇后續(xù)課程:中級R編程(https://www.datacamp.com/courses/intermediate-r)。另一種學(xué)習(xí)方法是在線版本swirl(https://www.datacamp.com/swirl-r-tutorial),它能讓您在類似RStudio環(huán)境中學(xué)習(xí)R語言。


在互動學(xué)習(xí)環(huán)境中,您可以選擇參加Coursera(https://www.coursera.org/specializations/jhu-data-science)或Edx(https://www.edx.org/course/introduction-r-programming-microsoft-dat204x-0)上mooc課程。


除了上述在線資源,您還可以考慮以下優(yōu)秀資源:


  • CRAN免費教學(xué)R語言(https://cran.r-project.org/doc/manuals/R-intro.pdf)。

  • Jared Lander’s R for Everyone(http://www.jaredlander.com/r-for-everyone/)

  • Quick-R(http://statmethods.net/)



專門學(xué)習(xí):閱讀、數(shù)據(jù)幀、表、概述、描述、加載和安裝包、使用繪圖命令可視化數(shù)據(jù)。


課后作業(yè)


  • 使用DataCamp免費在線R教程,熟悉基本的R語法。


  • 創(chuàng)建Github(http://github.com/)賬號。


  • 通過google幫助,解決安裝過程中出現(xiàn)的問題。


  • 安裝swirl包并學(xué)習(xí)R編程(見上文)。


步驟三:了解R社


強大社區(qū)的存在是R語言發(fā)展迅速、大獲成功的主要原因。社區(qū)中核心的是R語言的“包”生態(tài)系統(tǒng)。R語言程序包可以在CRAN、bioconductor、github和bitbucket中下載。在Rdocumentation(http://www.rdocumentation.org/)中,您可以輕松搜索來自CRAN、github和bioconductor中能滿足您當(dāng)前工作需要的程序包。與在R語言程序包生態(tài)系統(tǒng)同樣重要的是,您可以在R endeavours上輕松獲得幫助與反饋。首先,R內(nèi)置幫助系統(tǒng),您可以通過命令來訪問。同時,在Analytics Vidhya Discussions,Stack OverflowR語言是增長最快語言。R-bloggers(http://www.r-bloggers.com/)匯集許多R語言愛好者寫的博文。


課后作業(yè):


  • 訪問CranTask Views了解R語言生態(tài)系統(tǒng)。

  • http://r-bloggers.com上注冊并訂閱每日新聞。


步驟四:數(shù)據(jù)導(dǎo)入和操作


導(dǎo)入和操作數(shù)據(jù)是數(shù)據(jù)科學(xué)工作流程中重要步驟。R語言允許使用特定包導(dǎo)入不同數(shù)據(jù)格式,從而使您工作更輕松,如下:


  • readr:導(dǎo)入平面文件。

  • Readxl package:將excel文件轉(zhuǎn)化為R語言。

  • haven package包:讓您將SAS、STATA和SPSS數(shù)據(jù)文件導(dǎo)入R語言。

  • Databases:連接通過像RMySQL和RpostgreSQL包,使用DBI訪問和操作。

  • rvest: 網(wǎng)頁數(shù)據(jù)抓取。


一旦數(shù)據(jù)在工作環(huán)境中可用,您就可以使用下面程序包操作:


  • 整理數(shù)據(jù)的tidyr程序包。

  • stringr包處理字符串操作。

  • 對象數(shù)據(jù)幀,可以學(xué)習(xí)dplyr包輸入和輸出(https://www.datacamp.com/courses/dplyr-data-manipulation)。

  • 需要執(zhí)行繁重數(shù)據(jù)爭用任務(wù)?試試data.table程序包。

  • 執(zhí)行時間序列分析?嘗試一下像zoo,xts和quantmod程序包。


課后作業(yè)


  • 通過“導(dǎo)入數(shù)據(jù)進入R語言”課程,或閱讀文章1、2、3、4。掌握導(dǎo)入數(shù)據(jù)軟件包。

  • 通過RStudio觀看Data Wrangling with R 。(https://www.rstudio.com/resources/webinars/data-wrangling-with-r-and-rstudio/)

  • 閱讀并練習(xí)如何使用dplyr、tidyr和data.table程序包。


步驟五:有效數(shù)據(jù)可視化


自己創(chuàng)建數(shù)據(jù)可視化作品是一件很自豪的事情。然而,數(shù)據(jù)可視化既是一項技能,也是一門藝術(shù)。許多學(xué)者閱讀Edward Tufte 的“可視化定量數(shù)據(jù)”原理,或者StephenFew的 “pitfalls on dashboard design”。也可以閱讀NathanYau在FlowingData 寫的博文,來獲得創(chuàng)建R語言可視化靈感。


1.?平面圖無處不在


R語言提供了多種創(chuàng)建圖形方法,使用原理圖創(chuàng)建圖形是標準的方法。然而,有一些好的工具(或包)使用更簡單的方式來創(chuàng)建,查看圖形。


  • 在R語言中學(xué)習(xí)基本圖形語法是數(shù)據(jù)可視化中一種實用方法。

  • 在R語言中g(shù)gplot是數(shù)據(jù)可視化中最重要的包,并且很受歡迎,網(wǎng)上有很多它的學(xué)習(xí)資源,比如在線ggplot2教程,cheatsheet ,和以及一本由哈德利韋翰編寫的教學(xué)書。

  • ggvis程序包允許您使用基本圖形語法創(chuàng)建交互式web圖形(參見教程)。

  • 您知道Hans Rosling ted課程嗎?教您如何的用googleVis(一個帶有谷歌圖表接口)來重建圖表。

  • 如果您遇到了繪制數(shù)據(jù)的問題,這篇文章會對您有所幫助。在這個CRAN任務(wù)視圖中可以查看到更多的可視化資源?;蛘卟榭碦語言數(shù)據(jù)可視化指南。


2. 地圖無處不在


您對分析空間可視化數(shù)據(jù)感興趣嗎?學(xué)習(xí)本教程:介紹R語言空間數(shù)據(jù),您會輕松地使用這些包。


  • 源自Google maps和ggmap開放街道的靜態(tài)圖片,可用來創(chuàng)建可視化空間數(shù)據(jù)和模型。

  • Ari Lamstein’s中的choroplethr程序包。

  • tmap 程序包



3. HTML插件


HTML插件是R語言可視化產(chǎn)品中非常有前景的插件,您可以用簡單的方式創(chuàng)建交互式web可視化(參見RStudio教程),掌握這種可視化方法將會成為R語言學(xué)習(xí)中必備技能。其帶來的視覺效果會給您朋友和同事留下深刻印象。


  • leaflet創(chuàng)建動態(tài)圖片。

  • 使用dygraphs生成時間序列數(shù)據(jù)圖表。

  • 互動表(datatable)

  • DiagrammeR創(chuàng)建圖和流程圖。

  • MetricsGraphics創(chuàng)建散點圖、線圖和直方圖。


課后作業(yè)


  • 理解基本圖形語法原理。

  • 學(xué)習(xí)ggplot2教程。

  • 使用RStudio環(huán)境學(xué)習(xí)html插件。


步驟六:數(shù)據(jù)挖掘、機器學(xué)習(xí)


對于新的統(tǒng)計數(shù)據(jù)學(xué)習(xí)方法,我們推薦下列資源:


  • Andrew Conway’s課程:R語言統(tǒng)計數(shù)據(jù)簡介。

  • 杜克大學(xué)數(shù)據(jù)分析和統(tǒng)計推斷。

  • R語言實用數(shù)據(jù)科學(xué)。

  • 約翰霍普金斯大學(xué)數(shù)據(jù)科學(xué)專業(yè)課程。

  • R語言數(shù)據(jù)科學(xué)使用指南。


如果您想提高機器學(xué)習(xí)能力,可以考慮從以下教程開始學(xué)習(xí):


  • 機器學(xué)習(xí)算法要點。

  • 自行車共享大賽--一套R語言完整解決方案。

  • Kaggle上的機器學(xué)習(xí)課程。

  • 掌握機器學(xué)習(xí)。

  • 介紹機器學(xué)習(xí)。



確保在相關(guān)的CRAN任務(wù)視圖中查看到R語言可用的機器學(xué)習(xí)資源。


課后作業(yè)


  • 從統(tǒng)計學(xué)課程開始入門。

  • 學(xué)習(xí)Kaggle上免費機器學(xué)習(xí)課程。

  • 看Rattle中的一些R語言數(shù)據(jù)挖掘書。

  • 可以從這本小冊子上學(xué)習(xí)時間序列——A Little Book for Time Series in R .


步驟七:報告結(jié)果


與數(shù)據(jù)科學(xué)愛好者交流成果,分享見解是一件很重要的事情。幸運的是,R語言針對這個問題有一些非常實用工具。


第一個工具是R Markdown,采用knitr和pandoc復(fù)制方式生成您的數(shù)據(jù)分析結(jié)果報告。使用R markdown工具,R語言最終生成文檔,替換R語言代碼。文檔可以是html、word、pfd、ioslides等格式。您可以通過本教程學(xué)到更多知識并使用cheatsheet作為參考資料。


第二個工具是ReporteRs,它是個創(chuàng)建Microsoft(Worddocx和Powerpoint pptx)和html R語言文檔程序包,并可以在Windows、Linux、Unix和Mac OS系統(tǒng)上運行。像R Markdown工具一樣自動生成R語言報告,點擊這里我們來看看如何操作。


第三個是Shiny,目前R語言中最令人興奮的工具。使R語言構(gòu)建交互式web應(yīng)用程序變得非常容易。您可以把分析報告轉(zhuǎn)換為交互式web應(yīng)用程序,您不需要了解HTML、CSS或Javascript相關(guān)知識。如果您想要學(xué)習(xí)Shiny ,請點擊RStudio learning portal。


課后作業(yè)


  • 使用RMarkdown或ReporteRs創(chuàng)建第一個交互式報告。

  • 嘗試構(gòu)建一個Shiny應(yīng)用。


練習(xí)


只有通過大量練習(xí)才能成為優(yōu)秀R語言程序員。因此,要定期解決數(shù)據(jù)科學(xué)中的問題。我們的建議是趕緊開始與Kaggle上的數(shù)據(jù)科學(xué)家交流。

在解決問題中測試自己的R語言水平--練習(xí)中的問題。


步驟八:時間序列分析


R語言有一個用于專屬任務(wù)視圖時間序列。如果你想在R語言中做一些時間序列分析,這將是您開始的地方。您很快會發(fā)現(xiàn)工具的強大。


想要從在線資源中掌握時間序列分析是件不容易的事情。好的切入點是一本關(guān)于時間序列的書或者選擇《原理與實踐》這本書。在程序包方面,您需要熟悉Zoo與xts程序包。Zoo為您提供了常用的保存時間序列對象格式,而xts供了操作時間序列的數(shù)據(jù)集工具。


輔助資源:?時間序列綜合教程。


課后作業(yè)


  • 選擇上述列出的時間系列教程,開始您的分析。

  • 使用quantmod或quandl程序軟件包下載財務(wù)數(shù)據(jù),開始您的時間序列分析。

  • 使用諸如dygraphs的程序包創(chuàng)建您的可視化時間序列數(shù)據(jù)和分析。


文本挖掘一個重要工具


學(xué)習(xí)文本挖掘,您可以從edge課程中學(xué)習(xí)。雖然課程已經(jīng)結(jié)束,但是您仍然可以訪問這些課程。


練習(xí)


  • 文本挖掘競賽--一套R語言的完整解決方案。


步驟九:成為R語言大師


現(xiàn)在您已經(jīng)掌握了大部分R語言數(shù)據(jù)分析,是時候給出一些高級課程資源了。您很可能已經(jīng)知道其中的一些內(nèi)容,但不妨看看這些教程。


  • Hadley Wickham的高級R語言教程。

  • 在Hadoop、MongoDB或NoSQL中使用R語言。

  • 微軟的RevoScaleR 程序包

?

原文鏈接:

https://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-r-data-science/

作者:楊金鴻,北京護航科技有限公司員工,在業(yè)余時間喜歡翻譯一些技術(shù)文檔。喜歡閱讀有關(guān)數(shù)據(jù)挖掘、數(shù)據(jù)庫之類的書,學(xué)習(xí)java語言編程等,希望能在數(shù)據(jù)派平臺上熟識更多愛好相同的伙伴,今后能在數(shù)據(jù)科學(xué)的道路上走的更遠,飛的更遠。

本文轉(zhuǎn)自:數(shù)據(jù)派THU ;獲授權(quán);

END

合作請加QQ:365242293??

數(shù)據(jù)分析(ID?:?ecshujufenxi?)互聯(lián)網(wǎng)科技與數(shù)據(jù)圈自己的微信,也是WeMedia自媒體聯(lián)盟成員之一,WeMedia聯(lián)盟覆蓋5000萬人群。

總結(jié)

以上是生活随笔為你收集整理的超级干货 :手把手教你学习R语言(附资源链接)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。