R 基础入门(2)
目錄
一、繪圖
1.曲線圖?curve() 函數(shù)
2.加參考線?abline()
3.條形圖 barplot()
4.散點(diǎn)圖 plot()?
練習(xí):
二、讀取csv文件
1.表格數(shù)據(jù)
2.讀入表格數(shù)據(jù)
3.分類變量頻數(shù)統(tǒng)計(jì)
4.數(shù)值型變量的統(tǒng)計(jì)
三、調(diào)用自定義函數(shù)
一、繪圖
1.曲線圖?curve() 函數(shù)
用 curve() 函數(shù)制作 y = x2 函數(shù)的曲線圖,curve() 函數(shù)第二、第 三自變量是繪圖區(qū)間:
curve(x^2, -2, 2)返回:
?2.加參考線?abline()
類似地,sin(x) 函數(shù)曲線圖用如下程序可制作, 用 abline() 函數(shù)添加參考線: curve(sin(x), 0, 2*pi) abline(h=0)返回:
?3.條形圖 barplot()
假設(shè)有 10 個(gè)男生,7 個(gè)女生,如下程序繪制男生、女生人數(shù)的條形圖: barplot(c(" 男生"=10, " 女生"=7), main=" 男女生人數(shù)")返回:
?4.散點(diǎn)圖 plot()
plot() 函數(shù)做了散點(diǎn)圖, plot() 函數(shù)第一個(gè)自變量是各個(gè)點(diǎn)的 橫坐標(biāo)值,第二個(gè)自變量是對(duì)應(yīng)的縱坐標(biāo)值: plot(1:10, sqrt(1:10))返回:
?練習(xí):
1. 畫 exp(x) 在 (?2, 2) 區(qū)間的函數(shù)圖形。 2. 畫 ln(x) 在 (0.01, 10) 區(qū)間的函數(shù)圖形。二、讀取csv文件
1.表格數(shù)據(jù)
????????統(tǒng)計(jì)用的輸入數(shù)據(jù)典型樣式是 Excel 表那樣的表格數(shù)據(jù)。表格數(shù)據(jù)特點(diǎn):每一 列應(yīng)該是相同的類型(或者都是數(shù)值,或者都是文字,或者都是日期),每一列 應(yīng)該有一個(gè)名字。 ????????這樣的表格數(shù)據(jù),一般可以保存為.csv 格式:數(shù)據(jù)項(xiàng)之間用逗號(hào)分開,文件本 身是文本型的,可以用普通記事本程序查看和編輯。Excel 表可以用 “另存為” 命令保存為.csv 格式。常用的數(shù)據(jù)庫管理系統(tǒng)一般也可以把表保存為.csv 格式。2.讀入表格數(shù)據(jù)
用 read.csv 可以把.csv 文件讀入到 R 中: tax.tab <- read.csv("data.csv", header=TRUE, as.is=TRUE) print(head(tax.tab))- 選項(xiàng) header=TRUE 指明第一行作為變量名行,
- 選項(xiàng) as.is=TRUE 說 明字符型列要原樣讀入而不是轉(zhuǎn)換為因子 (factor)。
- 讀入的變量 tax.tab 稱為 一個(gè)數(shù)據(jù)框 (data.frame)。
- head() 函數(shù)返回?cái)?shù)據(jù)框或向量的前幾項(xiàng)。
- 比較大的表最好不要顯示整個(gè)表,會(huì)使得前面的運(yùn)行過程難以查看。
?3.分類變量頻數(shù)統(tǒng)計(jì)
用 table() 函數(shù)計(jì)算每個(gè)不同值的個(gè)數(shù),稱為頻數(shù) (frequency): table(tax.tab[["變量1"]])同樣,其他的也可以這樣統(tǒng)計(jì),只需要更換 變量名 。
也可以用 table() 函數(shù)統(tǒng)計(jì) “變量1” 和 “變量2” 交叉分類頻數(shù),如: table(tax.tab[["變量1"]], tax.tab[["變量2"]])還可以將上述,交叉分類頻數(shù)畫成表:
knitr::kable(table(tax.tab[["變量1"]], tax.tab[["變量2"]]) )4.數(shù)值型變量的統(tǒng)計(jì)
數(shù)值型變量可以計(jì)算各種不同的統(tǒng)計(jì)量, 如平均值、標(biāo)準(zhǔn)差和各個(gè)分位數(shù)。 summary() 可以給出最小值、最大值、中位數(shù)、四分之一分位數(shù)、四分之三分 位數(shù)和平均值。如 summary(tax.tab[["變量1"]]) 統(tǒng)計(jì)函數(shù)以一個(gè)數(shù)值型向量為自變量,包括 sum(求和), mean(平均值), var(樣 本方差), sd(樣本標(biāo)準(zhǔn)差), min(最小值), max(最大值), range(最小值和最大值) 等。如 mean(tax.tab[["變量1"]]) #均值 sd(tax.tab[["變量1"]]) #標(biāo)準(zhǔn)差 如果數(shù)據(jù)中有缺失值,可以刪去缺失值后計(jì)算統(tǒng)計(jì)量,這時(shí)在 mean, sd 等函數(shù)中加na.rm=TRUE 選項(xiàng)。三、調(diào)用自定義函數(shù)
只需要用 source() 函數(shù)可以運(yùn)行保存在一個(gè)文本文件中的源程序,即可調(diào)用該源程序中的的自定義函數(shù):
比如,如下內(nèi)容保存在文件 ssq.r 中:
sum.of.squares <- function(x){sum(x^2) }然后用如下 source() 命令運(yùn)行源程序:
source("ssq.r") 運(yùn)行后就可以調(diào)用自定義函數(shù) sum.of.squares() 了。 sum.of.squares(1:5)返回:
總結(jié)
- 上一篇: android 图片传递,如何使用包在A
- 下一篇: 油猴的简介和安装