rstudio 保存_Rstudio学习笔记
老師上課時說,我們在學習語言的過程中有遇到不懂的地方可以在知乎、論壇等網站搜索學習,也希望我們把學到的知識筆記分享出去幫助更多的人~于是我就準備在知乎整理一下我最近學習的筆記啦~在方便復習的同時,希望也能幫到在學習R語言過程中遇到困難的你們~
基本數據管理
#創建leadership數據框
manager <- c(1,2,3,4,5) date <- c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09") country<-c("US","US","UK","UK","UK") gender <- c("M","F","F","M","F") age <- c(32,45,25,39,99) q1 <- c(5,3,3,3,2) q2 <- c(4,5,5,3,2) q3 <- c(5,2,5,4,1) q4 <- c(5,5,5,NA,2) q5 <- c(5,5,2,NA,1) leadership <- data.frame(manager,date,gender,age,q1,q2,q3,q4,q5, stringsAsFactors=FALSE) leadership運行結果如下(在代碼輸入區選中全部代碼按ctrl+enter即可運行):
#創建新變量
語句形式:變量名<-表達式
- 例如:假如你有一個數據框,其中變量為x1,x2,那么a<-x1+x2,a就是你創建的新變量,即x1,x2這兩個變量的加和。
書本上共介紹了三種方法創建新變量,分別為:
①
mydata<-data.frame(x1=c(2,1,3,5),x2=c(4,4,2,9)) mydata$sumx<-mydata$x1+mydata$x2 mydata$meanx<-(mydata$x1+mydata$x2)/2 mydata運行結果如下:
②
mydata<-data.frame(x1=c(2,1,3,5),x2=c(4,4,2,9)) attach(mydata) mydata$sumx <- x1 + x2 mydata$meanx <- (x1 + x2)/2 detach(mydata) mydata- attach()和detach()一般成對出現,用這兩個函數是為了免去下面的代碼輸入的繁雜。
運行結果如下:
③
mydata<-data.frame(x1=c(2,1,3,5),x2=c(4,4,2,9)) mydata <- transform(mydata,sumx = x1 + x2,meanx = (x1 + x2)/2) mydata- transform()函數簡化了按需創建新變量并將其保存到數據框中的過程。
運行結果如下:
#變量的重編碼
leadership$agecat[leadership$age > 75] <- "Elder" leadership$agecat[leadership$age >= 55 &leadership$age <= 75] <- "Middle Aged" leadership$agecat[leadership$age < 55] <- "Young" leadership運行結果如下:
或
leadership <- within(leadership,{agecat <- NAagecat[age > 75] <- "Elder"agecat[age >= 55 & age <= 75] <- "Middle Aged"agecat[age < 55] <- "Young" }) leadership- 課本上說函數within()與函數with()類似,我查了一下函數with()的作用是簡化代碼,僅供參考。
#變量的重命名
如果對現有的變量名稱不滿意,你可以交互式地或以編程的方式修改它們。
若以交互式,你可以通過函數fix()來調用一個交互式的編輯器,這里就不舉例啦。
若以編程方式,可以通過names()函數來重命名變量。例如:
names(leadership) names(leadership)[5] <- "AGE" leadership運行結果如下:
#缺失值
在Rstudio中,缺失值以符號NA(Not Available)表示,而函數is.na()則是用于識別缺失值是否存在。如果某個元素是缺失值,相應的位置將改寫為TRUE,不是缺失值的位置則為FALSE。而na.omit()函數可以刪除所有含有缺失數據的行。
leadership$AGE[leadership$AGE==99]<-NA leadership is.na(leadership) na.omit(leadership)運行結果如下:
#日期值
%d 數字表示的日期(0~31) %a 縮寫的星期名(Mon) %A 非縮寫的中文名(Monday) %m 月份(00~12) %b 縮寫的月份(Jan) %B 非縮寫的月份(January) %y 兩位數的年份(07) %Y 四位數的年份(2007)日期值的默認輸入格式為yyy-mm-dd。
Sys.Date()可以返回當天的日期,而date()則返回當前的日期和時間。
- 函數format(x,format="output_format")是用來輸出指定格式的日期值,并且可以提取日期值中的某些部分:
- 在日期值上還可以執行算術運算:
- 最后,也可以使用函數difftime()來計算時間間隔,并以星期、天、時、分、秒來表示。
#類型轉換
名為is.datatype()這樣的函數返回TRUE或FALSE,而as.datatype()這樣的函數則將其參數轉換為對應的類型。如下所示:
#數據排序
可以用order()函數對一個數據框進行排序,默認的排序順序是升序,在排序變量的前邊加一個減號即可得到降序的排序結果。如下:
#數據集的合并
- 橫向合并
- 縱向合并
#剔除變量
#subset()函數
選擇變量和觀測變量最簡單的方法。示例如下:
#隨機抽樣
sample( )函數可以實現數據的隨機抽樣。基本表達形式為:
sample(x, size, replace = FALSE)
簡介:其中x是數值型向量,size是抽樣個數,replace表示是否有放回抽樣,默認FALSE是無放回抽樣,TRUE是有放回抽樣。
以上就是我這周的課堂學習筆記啦~代碼大部分都是課本里的哦,還有老師課堂上講的一些~實不相瞞,我也還學藝未精,如果看到的小伙伴發現有什么錯誤,望批評指正哦~大家一起學習吧!學習R語言一定要有耐心哦~
總結
以上是生活随笔為你收集整理的rstudio 保存_Rstudio学习笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第三次握手为什么没有序列号_图解TCP三
- 下一篇: 测试无数据_fpc柔性线路板压合辅材的测