R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程
1. 數(shù)據(jù)分析的開端,Tidyverse?
tidyverse 是一個(gè)清晰的 R 包集合,在數(shù)據(jù)操作、探索和可視化領(lǐng)域提供統(tǒng)一的數(shù)據(jù)科學(xué)解決方案,這些解決方案具有共同的設(shè)計(jì)理念。它是由 RStudio 背后的首席科學(xué)家 Hadley Wickham 創(chuàng)建的。tidyverse 中的 R 包旨在提高統(tǒng)計(jì)學(xué)家和數(shù)據(jù)科學(xué)家的工作效率。包引導(dǎo)他們完成工作流程,促進(jìn)溝通并產(chǎn)生可重復(fù)的工作產(chǎn)品。tidyverse 本質(zhì)上側(cè)重于使工作流成為可能的工具的互聯(lián)。在數(shù)據(jù)科學(xué)項(xiàng)目中采用 tidyverse有很多優(yōu)勢(shì)。它提供一致的功能、工作流覆蓋范圍、數(shù)據(jù)科學(xué)教育、數(shù)據(jù)科學(xué)工具開發(fā)的簡化路徑以及提高生產(chǎn)力的潛力。
它的主要目標(biāo)之一是幫助任何需要分析數(shù)據(jù)的人高效地工作。如下圖所示,tidyverse可以幫助你實(shí)現(xiàn):
數(shù)據(jù)導(dǎo)入/導(dǎo)出
數(shù)據(jù)清洗處理
批量建模
數(shù)據(jù)/模型結(jié)果可視化
生成(可交互)的分析報(bào)告. (eg. pdf, word, ppt)
本文主要討論前兩個(gè)目標(biāo)及數(shù)據(jù)的創(chuàng)建導(dǎo)入導(dǎo)出,以及數(shù)據(jù)清洗處理。
-
tidyverse核心:管道操作 %>%
進(jìn)行數(shù)據(jù)分析前先導(dǎo)入必要的包和數(shù)據(jù):
1library(tidyverse) 2library(rio) 3data("german", package = "rchallenge")首先查看你的數(shù)據(jù)集:
總結(jié)
以上是生活随笔為你收集整理的R语言实战应用精讲50篇(三十一)-R语言入门系列-tidyverse数据分析流程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数学建模】MATLAB应用实战系列(八
- 下一篇: 【在CSDN创作2021年度总结】202