日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

R语言扩展包dplyr——数据清洗和整理

發(fā)布時間:2025/4/5 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 R语言扩展包dplyr——数据清洗和整理 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

R語言擴展包dplyr——數(shù)據(jù)清洗和整理

標簽:?數(shù)據(jù)R語言數(shù)據(jù)清洗數(shù)據(jù)整理 ?分類: R Programming(11)?

該包主要用于數(shù)據(jù)清洗和整理,coursera課程鏈接:Getting and Cleaning Data

也可以載入swirl包,加載課Getting and Cleaning Data跟著學習。

如下:

?

[html]?view plaincopy
  • library(swirl)??
  • install_from_swirl("Getting?and?Cleaning?Data")??
  • swirl()??

  • ?

    此文主要是參考R自帶的簡介:Introduce to dplyr

    1、示范數(shù)據(jù)

    ?

    [html]?view plaincopy
  • >?library(nycflights13)??
  • >?dim(flights)??
  • [1]?336776?????16??
  • >?head(flights,?3)??
  • Source:?local?data?frame?[3?x?16]??
  • ??
  • ??year?month?day?dep_time?dep_delay?arr_time?arr_delay?carrier?tailnum?flight?origin?dest?air_time??
  • 1?2013?????1???1??????517?????????2??????830????????11??????UA??N14228???1545????EWR??IAH??????227??
  • 2?2013?????1???1??????533?????????4??????850????????20??????UA??N24211???1714????LGA??IAH??????227??
  • 3?2013?????1???1??????542?????????2??????923????????33??????AA??N619AA???1141????JFK??MIA??????160??
  • Variables?not?shown:?distance?(dbl),?hour?(dbl),?minute?(dbl)??

  • 2、將過長的數(shù)據(jù)整理成友好的tbl_df數(shù)據(jù)

    ?

    ?

    [html]?view plaincopy
  • >?flights_df?<-?tbl_df(flights)??
  • >?flights_df??
  • ?

    ?

    3、篩選filter()

    ?

    [html]?view plaincopy
  • >?filter(flights_df,?month?==?1,?day?==?1)??
  • Source:?local?data?frame?[842?x?16]??
  • ??
  • ???year?month?day?dep_time?dep_delay?arr_time?arr_delay?carrier?tailnum?flight?origin?dest?air_time??
  • 1??2013?????1???1??????517?????????2??????830????????11??????UA??N14228???1545????EWR??IAH??????227??
  • 2??2013?????1???1??????533?????????4??????850????????20??????UA??N24211???1714????LGA??IAH??????227??
  • 篩選出month=1和day=1的數(shù)據(jù)

    ?

    同樣效果的,

    ?

    [html]?view plaincopy
  • flights_df[flights_df$month?==?1?&?flights_df$day?==?1,?]??

  • 4、選出幾行數(shù)據(jù)slice()

    ?

    ?

    [html]?view plaincopy
  • slice(flights_df,?1:10)??

  • 5、排列arrange()

    ?

    ?

    [html]?view plaincopy
  • >arrange(flights_df,?year,?month,?day)??
  • 將flights_df數(shù)據(jù)按照year,month,day的升序排列。

    ?

    降序

    ?

    [html]?view plaincopy
  • >arrange(flights_df,?year,?desc(month),?day)??
  • R語言當中的自帶函數(shù)

    ?

    ?

    [html]?view plaincopy
  • flights_df[order(flights$year,?flights_df$month,?flights_df$day),?]??
  • flights_df[order(desc(flights_df$arr_delay)),?]??
  • ?

    ?

    6、選擇select()

    通過列名來選擇所要的數(shù)據(jù)

    [html]?view plaincopy
  • select(flights_df,?year,?month,?day)??
  • 選出三列數(shù)據(jù)
    使用:符號
    [html]?view plaincopy
  • select(flights_df,?year:day)??
  • 使用-來刪除不要的列表

    ?

    ?

    [html]?view plaincopy
  • select(flights_df,?-(year:day))??

  • 7、變形mutate()

    ?

    產(chǎn)生新的列

    ?

    [html]?view plaincopy
  • >?mutate(flights_df,??
  • +????????gain?=?arr_delay?-?dep_delay,??
  • +????????speed?=?distance?/?air_time?*?60)??
  • ?

    ?

    8、匯總summarize()
    [html]?view plaincopy
  • <pre?name="code"?class="html">>?summarise(flights,??
  • +???????????delay?=?mean(dep_delay,?na.rm?=?TRUE)??
  • 求dep_delay的均值

    ?

    ?

    9、隨機選出樣本

    ?

    [html]?view plaincopy
  • sample_n(flights_df,?10)??
  • 隨機選出10個樣本
    [html]?view plaincopy
  • sample_frac(flights_df,?0.01)??
  • 隨機選出1%個樣本

    ?

    10、分組group_py()

    ?

    [html]?view plaincopy
  • by_tailnum?<-?group_by(flights,?tailnum)??
  • #確定組別為tailnum,賦值為by_tailnum??
  • delay?<-?summarise(by_tailnum,??
  • ???????????????????count?=?n(),??
  • ???????????????????dist?=?mean(distance,?na.rm?=?TRUE),??
  • ???????????????????delay?=?mean(arr_delay,?na.rm?=?TRUE))??
  • #匯總flights里地tailnum組的分類數(shù)量,及其組別對應的distance和arr_delay的均值??
  • delay?<-?filter(delay,?count?>?20,?dist?<?2000)??
  • ggplot(delay,?aes(dist,?delay))?+??
  • ????geom_point(aes(size?=?count),?alpha?=?1/2)?+??
  • ????geom_smooth()?+??
  • ????scale_size_area()??


  • ?

    ?

    結果都需要通過賦值存儲

    ?

    [html]?view plaincopy
  • a1?<-?group_by(flights,?year,?month,?day)??
  • a2?<-?select(a1,?arr_delay,?dep_delay)??
  • a3?<-?summarise(a2,??
  • ??arr?=?mean(arr_delay,?na.rm?=?TRUE),??
  • ??dep?=?mean(dep_delay,?na.rm?=?TRUE))??
  • a4?<-?filter(a3,?arr?>?30?|?dep?>?30)??

  • 11、引入鏈接符%>%

    ?

    使用時把數(shù)據(jù)名作為開頭,然后依次對數(shù)據(jù)進行多步操作:

    ?

    [html]?view plaincopy
  • flights?%>%??
  • ????group_by(year,?month,?day)?%>%??
  • ????select(arr_delay,?dep_delay)?%>%??
  • ????summarise(??
  • ????????arr?=?mean(arr_delay,?na.rm?=?TRUE),??
  • ????????dep?=?mean(dep_delay,?na.rm?=?TRUE)??
  • ????)?%>%??
  • ????filter(arr?>?30?|?dep?>?30)??
  • 前面都免去了數(shù)據(jù)名

    ?

    ?

    若想要進行更多地了解這個包,可以參考其自帶的說明書(60頁):dplyr

    總結

    以上是生活随笔為你收集整理的R语言扩展包dplyr——数据清洗和整理的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。

    主站蜘蛛池模板: 毛片无限看 | 天堂成人国产精品一区 | ass极品国模人体欣赏 | 国产尤物网站 | 免费色播 | 一区二区三区精品视频 | 日本高清黄色电影 | 双性懵懂美人被强制调教 | 亚洲高清视频在线播放 | 亚洲精品乱码久久久久久不卡 | 日本乱大交xxxx公交车 | 日韩精品亚洲精品 | 国产成人短视频在线观看 | 99热这| 成人毛片一区二区三区 | 精品视频一区二区三区在线观看 | jvid乐乐| 国产成人精品视频ⅴa片软件竹菊 | 自拍日韩亚洲一区在线 | 999精品在线 | 国产精品第12页 | 国产精品羞羞答答在线 | 亚洲午夜精品久久久久久浪潮 | 经典一区二区 | 秋霞午夜影院 | 91国在线| 国产日韩欧美另类 | 国产成人在线一区二区 | 强睡邻居人妻中文字幕 | 伊人影院在线播放 | 中国老头性行为xxxx | 欧美日韩六区 | 无码人妻少妇色欲av一区二区 | 黄色资源在线观看 | 久久av秘一区二区三区 | 日本精品网站 | 一区二区在线 | 国产精品高潮呻吟 | 成人公开视频 | 荒岛淫众女h文小说 | 野花国产精品入口 | 精品人妻无码一区二区三区换脸 | 天堂v在线观看 | 一本色道久久88亚洲精品综合 | 亚洲av无码一区二区三区dv | 欧美精品一区二区免费 | 亚洲一区电影 | 亚洲男人天堂网 | 在线色 | 一卡二卡国产 | 欧美h网站 | 国产66页 | 中文字幕免费在线看线人 | 欧美精品一区二区三区四区 | 欧美日在线| 人人97| 亚洲三级电影网站 | 黄色片免费在线播放 | 一区二区欧美在线观看 | 好吊视频一区 | 狠狠狠狠狠 | 久久久久久视 | 99久久免费看精品国产一区 | 亚洲国产成人精品91久久久 | 国产又粗又猛又色 | 黑鬼巨鞭白妞冒白浆 | 日韩av中文字幕在线免费观看 | 欧美一级录像 | 福利社午夜影院 | 亚洲欧美日韩国产成人精品影院 | 成人爽站w47pw | 欧美日韩性生活视频 | 国产精品不卡 | 超碰在线成人 | 成人av动漫在线观看 | 农村搞破鞋视频大全 | 玩偶游戏在线观看免费 | 亚洲乱码国产一区三区 | 在线97视频 | 国产51视频 | 干老太太视频 | 亚洲欧洲一级 | 少妇一级淫片 | 激情深爱五月 | 欧美性猛交xxxx乱大交蜜桃 | 免费看av大片 | 久久99久久99精品免视看婷婷 | 国产a√精品区二区三区四区 | 欧美 日韩 国产 亚洲 色 | 九九热免费精品视频 | av在线网站观看 | 日韩亚洲欧美一区 | 免费国产区 | 日本三级一区二区 | 欧美xxxxx少妇| 欧美成人一二区 | 久久www视频 | 美女网站在线看 | 国产精品黄色网 |