R语言系列—区间估计
這一篇講的是區(qū)間估計(jì)…..因?yàn)檫@不是一個(gè)關(guān)于統(tǒng)計(jì)學(xué)的系列,所以對文中出現(xiàn)的公式不會給予任何證明…..就是這樣。
就從一個(gè)最簡單的正態(tài)分布的方差已知時(shí),求均值的置信區(qū)間開始吧。
書上的公式告訴我們這個(gè)區(qū)間是 $\overline{x}\pm(\sigma/\sqrt{n})z_{1-\sigma/2}$,其中Zp表示的是正態(tài)分布N(0,1)下側(cè)的p分位數(shù)。
我們用R來實(shí)現(xiàn)求得這一結(jié)果的過程。下面設(shè)x里存儲了給出的樣本,sigma表示已知的方差,n表示樣本的個(gè)數(shù), alpha則是(1-置信水平)
mean<-mean(x)
ans<-c(mean-sigma*qnorm(1-alpha / 2)/sqrt(n) , mean+sigma*qnorm(1-alpha / 2)/sqrt(n))
這樣,ans就存儲了要求的置信區(qū)間。
來解釋一下吧,先用mean(x)求出樣本的平均值,然后用qnorm(1-alpha / 2)求出Z1-a/2,(還記得么?前綴q是分位數(shù)函數(shù),)剩下的就是套公式的加減法了。
這里的qnorm(1-alpha / 2)其實(shí)省略了很多參數(shù),完整一些的寫法是
qnorm(1-alpha/2,mean=0,sd=1,lower.tail=TRUE)
第一個(gè)參數(shù)就不用解釋了,第二,三個(gè)參數(shù)mean=0,sd=1,表示這是一個(gè)標(biāo)準(zhǔn)正態(tài)分布(不同于前面,這里增加了mean=和sd=,這種做法的好處是可以改變參數(shù)的順序,但是結(jié)果是一樣的),最后一個(gè)參數(shù)lower.tail這個(gè)參數(shù)的意思就比較有意思了,官方解釋如下:
if TRUE (default), probabilities are P[X <= x], otherwise, P[X > x].
明白了么?等于真的話,得出的就是X<=x的分位數(shù),為假的話就是從X>x的方法尋找這個(gè)值。一般我們用默認(rèn)的真就可以了。
接下來我們把它整理成一個(gè)函數(shù),方便使用
z.test<-function(x,n,sigma,alpha){
mean<-mean(x)
ans<-c(
mean-sigma*qnorm(1-alpha/2,mean=0,sd=1,lower.tail=TRUE)/sqrt(n),
mean+sigma*qnorm(1-alpha/2,mean=0,sd=1,lower.tail=TRUE)/sqrt(n))
ans
}
這樣我們就可以直接使用z.test()完成對u的置信區(qū)間的計(jì)算。
比如,有10個(gè)樣本,分別是175,176,173,175,174,173,173,176,173,179。標(biāo)準(zhǔn)差為1.5,求均值95%的置信區(qū)間:
x<-c(175,176,173,175,174,173,173,176,173,179)
z.test(x,10,1.5,0.05)
則返回置信區(qū)間:
[1] 173.7703 175.6297
總結(jié)
以上是生活随笔為你收集整理的R语言系列—区间估计的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 显示等待WebDriverWait常用写
- 下一篇: java代码修改了之后运行仍然是原程序