R语言各种假设检验实例整理(常用)
轉(zhuǎn)載自#博客園# @ywliao
一、正態(tài)分布參數(shù)檢驗(yàn)
例1. 某種原件的壽命X(以小時(shí)計(jì))服從正態(tài)分布N(μ, σ)其中μ, σ2均未知。現(xiàn)測(cè)得16只元件的壽命如下:
159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170問(wèn)是否有理由認(rèn)為元件的平均壽命大于255小時(shí)?解:按題意,需檢驗(yàn)H0: μ ≤ 225 H1: μ > 225此問(wèn)題屬于單邊檢驗(yàn)問(wèn)題可以使用R語(yǔ)言t.testt.test(x,y=NULL,alternative=c("two.sided","less","greater"),mu=0,paired=FALSE,var.equal=FALSE,conf.level=0.95)其中x,y是又?jǐn)?shù)據(jù)構(gòu)成e向量,(如果只提供x,則作單個(gè)正態(tài)總體的均值檢驗(yàn),如果提供x,y則作兩個(gè)總體的均值檢驗(yàn)),alternative表示被則假設(shè),two.sided(缺省),雙邊檢驗(yàn)(H1:μ≠H0),less表示單邊檢驗(yàn)(H1:μ<μ0),greater表示單邊檢驗(yàn)(H1:μ>μ0),mu表示原假設(shè)μ0,conf.level置信水平,即1-α,通常是0.95,var.equal是邏輯變量,var.equal=TRUE表示兩樣品方差相同,var.equal=FALSE(缺省)表示兩樣本方差不同。R代碼:X<-c(159, 280, 101, 212, 224, 379, 179, 264,222, 362, 168, 250, 149, 260, 485, 170)t.test(X,alternative = "greater",mu=225)結(jié)果:可見(jiàn)P值為0.257 > 0.05 ,不能拒絕原假設(shè),接受H0,即平均壽命不大于225小時(shí)。例2.在平爐上進(jìn)行的一項(xiàng)試驗(yàn)以確定改變操作方法的建議是否會(huì)增加剛的得率,試驗(yàn)時(shí)在同一個(gè)平爐上進(jìn)行的,每煉一爐剛時(shí)除操作方法外,其它條件都盡可能做到相同,先用標(biāo)準(zhǔn)方法煉一爐,然后用新方法煉一爐,以后交替進(jìn)行,各煉了10爐,其得率分別為標(biāo)準(zhǔn)方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1設(shè)這兩個(gè)樣本相互獨(dú)立,且分別來(lái)自正態(tài)總體N(μ1, σ2)和N(μ2, σ2),其中μ1,μ2和σ2未知。問(wèn)新的操作能否提高得率?(取α=0.05)
解1:根據(jù)題意,需要假設(shè)H0: μ1 ≥ μ2 H1: μ1 < μ2 這里假定σ12=σ22=σ2,因此選擇t.test,var.equal=TRUER代碼:X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3) Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1) t.test(X,Y,var.equal = TRUE,alternative = "less")結(jié)果:
可見(jiàn)P值<0.05,接受備擇假設(shè),即新的操作能夠提高得率。解2:因?yàn)閿?shù)據(jù)是成對(duì)出現(xiàn)的,所以采用成對(duì)數(shù)據(jù)t檢驗(yàn)比上述的雙樣本均值檢驗(yàn)更準(zhǔn)確。所謂成對(duì)t檢驗(yàn)就是Zi=Xi-Yi,再對(duì)Z進(jìn)行單樣本均值檢驗(yàn)R代碼:X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3) Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1) t.test(X-Y, alternative = "less")結(jié)果:可見(jiàn)P值<0.05,接受備擇假設(shè),即新的操作能夠提高得率。并且P值更小可見(jiàn)比雙樣本均值檢驗(yàn)更準(zhǔn)確
例3.對(duì)例2進(jìn)行方差檢驗(yàn),方差是否相同
解:根據(jù)題意,需檢驗(yàn)H0: σ12 = σ22 H1: σ12 ≠ σ22方差檢驗(yàn)可以用var.testvar.test(x, y, ratio = 1,alternative = c("two.sided", "less", "greater"),conf.level = 0.95, ...)x,y是來(lái)自兩樣本數(shù)據(jù)構(gòu)成的向量,ratio是方差比的原假設(shè),缺省值為1.alternative是備擇假設(shè),two.sided表示雙邊檢驗(yàn)(H1:σ12/σ22<ratio),greater表示單邊檢驗(yàn)(H1:σ12)R代碼:X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3) Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1) var.test(X,Y)結(jié)果:可見(jiàn)P值為0.559>0.05,接受原假設(shè),認(rèn)為兩者方差相同
二、二項(xiàng)分布參數(shù)檢驗(yàn)
例4.有一批蔬菜種子的平均發(fā)芽率p0=0.85,現(xiàn)隨即抽取500粒,用種衣劑進(jìn)行浸種處理,結(jié)果有445粒發(fā)芽。試檢驗(yàn)種衣劑對(duì)種子發(fā)芽率有無(wú)效果。解:根據(jù)題意,所檢驗(yàn)的問(wèn)題為H0:p=p0=0.85, H1:p≠p0可以用R語(yǔ)言的binom.testbinom.test(x, n, p = 0.5,alternative = c("two.sided", "less", "greater"),conf.level = 0.95)其中x是成功的次數(shù);或是一個(gè)由成功數(shù)和失敗數(shù)組成的二維向量。n是試驗(yàn)總數(shù),當(dāng)x是二維向量時(shí),此值無(wú)效。P是原假設(shè)的概率。R語(yǔ)言代碼:binom.test(445,500,p=0.85)
結(jié)果:
可知P值0.01207<0.05,拒絕原假設(shè),說(shuō)明種衣劑對(duì)種子的發(fā)芽率有顯著效果。三、其它重要的非參數(shù)檢驗(yàn)法
3.1.理論分布完全已知的情況下
3.1.1.皮爾森擬合優(yōu)度檢驗(yàn)例5.某消費(fèi)者協(xié)會(huì)為了確定市場(chǎng)上消費(fèi)者對(duì)5種品牌啤酒的喜好情況,隨即抽取了1000名啤酒愛(ài)好者作為樣品進(jìn)行試驗(yàn):每個(gè)人得到5種品牌的啤酒各一瓶,但未標(biāo)明牌子。這5種啤酒分別按著A、B、C、D、E字母的5張紙片隨即的順序送給每一個(gè)人。下表是根據(jù)樣本資料整理的各種品牌啤酒愛(ài)好者的頻數(shù)分布。試根據(jù)這些數(shù)據(jù)判斷消費(fèi)者對(duì)這5種品牌啤酒的愛(ài)好有無(wú)明顯差異?最喜歡的牌子 A B C D E人數(shù)X 210 312 170 85 223解:如果消費(fèi)者對(duì)5種品牌的啤酒無(wú)顯著差異,那么,就可以認(rèn)為喜好這5種拍品啤酒的人呈均勻分布,即5種品牌啤酒愛(ài)好者人數(shù)各占20%。據(jù)此假設(shè)H0:喜好5種啤酒的人數(shù)分布均勻可以使用Pearson χ2擬合優(yōu)度檢驗(yàn),R語(yǔ)言中調(diào)用chisq.test(X)chisq.test(x, y = NULL, correct = TRUE,p = rep(1/length(x), length(x)), rescale.p = FALSE,simulate.p.value = FALSE, B = 2000)其中x是由觀測(cè)數(shù)據(jù)構(gòu)成的向量或者矩陣,y是數(shù)據(jù)向量(當(dāng)x為矩陣時(shí),y無(wú)效)。correct是邏輯變量,標(biāo)明是否用于連續(xù)修正,TRUE(缺省值)表示修正,FALSE表示不修正。p是原假設(shè)落在小區(qū)間的理論概率,缺省值表示均勻分布,rescale.p是邏輯變量,選擇FALSE(缺省值)時(shí),要求輸入的p滿足和等于1;選擇TRUE時(shí),并不要求這一點(diǎn),程序?qū)⒅匦掠?jì)算p值。simulate.p.value邏輯變量(缺省值為FALSE),當(dāng)為T(mén)RUE,將用仿真的方法計(jì)算p值,此時(shí),B表示仿真的此值。R語(yǔ)言代碼:X<-c(210, 312, 170, 85, 223)
chisq.test(X)
結(jié)果:例6.為研究電話總機(jī)在某段時(shí)間內(nèi)接到的呼叫次數(shù)是否服從Poisson分布,現(xiàn)收集了42個(gè)數(shù)據(jù),如下表所示,通過(guò)對(duì)數(shù)據(jù)的分析,問(wèn)能否確認(rèn)在某段時(shí)間內(nèi)接到的呼叫次數(shù)服從Poisson分布(α = 0.1)?解:R語(yǔ)言代碼:#輸入數(shù)據(jù) X<-0:6; Y<-c(7, 10, 12, 8, 3, 2, 0) #計(jì)算理論分布,其中mean(rep(X,Y))為樣本均值 q<-ppois(X, mean(rep(X,Y))); n<-length(Y) p=rep(0,n) p[1]<-q[1]; p[n]<-1-q[n-1] for (i in 2:(n-1))p[i]<-q[i]-q[i-1] #作檢驗(yàn) chisq.test(Y,p=p)提示結(jié)果可能不準(zhǔn)確,因?yàn)槠柹ǚ綌M合由度檢驗(yàn)要求分組后每組的頻數(shù)至少要大于等于5,而后三組中出現(xiàn)的頻率分別為3,2,0,均小于5,解決問(wèn)題的方法是將后三組合成一組,此時(shí)的頻數(shù)為5,滿足要求,重寫(xiě)R語(yǔ)言代碼
R語(yǔ)言代碼:#輸入數(shù)據(jù)
X<-0:6; Y<-c(7, 10, 12, 8, 3, 2, 0)
#計(jì)算理論分布,其中mean(rep(X,Y))為樣本均值
q<-ppois(X, mean(rep(X,Y))); n<-length(Y)
p<-rep(0,n)
p1<-q1; p[n]<-1-q[n-1]
for (i in 2:(n-1))
p[i]<-q[i]-q[i-1]
#重新分組
Z<-c(7, 10, 12, 8, 5)
#重新計(jì)算理論分布
n<-length(Z); p<-p[1:n-1]; p[n]<-1-q[n-1]
#作檢驗(yàn)
chisq.test(Z,p=p)
可見(jiàn)P值>>0.1,可以確認(rèn)在某段時(shí)間之內(nèi)接到的電話次數(shù)服從Poisson 分布
3.1.2.正態(tài)W檢驗(yàn)
例7.已知15名學(xué)生體重如下,問(wèn)是否服從正態(tài)分布解:R語(yǔ)言代碼:w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0) shapiro.test(w)P值>0.05,接受原假設(shè),認(rèn)為來(lái)自正態(tài)分布總體。
3.2.理論分布依賴于若干個(gè)未知參數(shù)的情況
3.2.1Kolmogorov-Smirnov 檢驗(yàn)
例8.對(duì)一臺(tái)設(shè)備進(jìn)行壽命檢驗(yàn),記錄10次無(wú)故障工作時(shí)間,并按從小到大的次序排列如下:(單位)420 500 920 1380 1510 1650 1760 2100 2300 2350試用Kolmogorov-Smirnov K 檢驗(yàn)方法檢驗(yàn)此設(shè)備無(wú)故障工作時(shí)間分布是否服從λ = 1/1500的指數(shù)分布?解: R語(yǔ)言進(jìn)行Kolmogorov-Smirnov K 檢驗(yàn)使用ks.test( )
ks.test(x, y, ..., alternative = c("two.sided", "less", "greater"), exact = NULL) # x是待檢測(cè)的樣品構(gòu)成的向量,y是原假設(shè)的數(shù)據(jù)向量或是原假設(shè)的字符串。R語(yǔ)言代碼:X<-c(420, 500, 920, 1380, 1510, 1650, 1760, 2100, 2300, 2350)ks.test(X, "pexp", 1/1500)P值大于0.05,無(wú)法拒絕原假設(shè),因此認(rèn)為此設(shè)備無(wú)故障工作時(shí)間的分布服從λ = 1/1500的指數(shù)分布。例9.假定從分布函數(shù)未知的F(x)和G(x)的總體中分別抽出25個(gè)和20個(gè)觀察值的隨即樣品,其數(shù)據(jù)由下表所示。現(xiàn)檢驗(yàn)F(x)和G(x)是否相同。R語(yǔ)言代碼:X<-scan( )0.61 0.29 0.06 0.59 -1.73 -0.74 0.51 -0.561.64 0.05 -0.06 0.64 -0.82 0.37 1.772.36 1.31 1.05 -0.32 -0.40 1.06 -2.470.39 1.09 -1.28Y<-scan( )2.20 1.66 1.38 0.20 0.36 0.000.96 1.56 0.44 1.50 -0.30 0.66 2.31 3.29 -0.27 -0.37 0.38 0.700.52 -0.71ks.test(X,Y)P值>0.05,無(wú)法拒絕原假設(shè),說(shuō)明F(x)和G(x)分布函數(shù)相同。
3.2.2.列聯(lián)表數(shù)據(jù)的檢驗(yàn)
例10.為了研究吸煙是否與患肺癌相關(guān),對(duì)63位肺癌患者及43名非肺癌患者(對(duì)照組)調(diào)查了其中的吸煙人數(shù),得到2x2列聯(lián)表,如下表所示解:
進(jìn)行Pearson卡方檢驗(yàn)R語(yǔ)言代碼:x<-c(60, 3, 32, 11)dim(x)<- c(2,2)chisq.test(x,correct = F)P值<0.05,拒絕原假設(shè),認(rèn)為吸煙與患肺癌相關(guān)。
例11.某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染HBV的結(jié)果,將33例HBsAg陽(yáng)性孕婦隨即分為預(yù)防注射組和對(duì)照組,結(jié)果由下表所示,問(wèn)兩組新生兒的HBV總體感染率有無(wú)差別?
解: 最小期望值T=(11*9)/33=3 < 5 ,因此不能使用卡方檢驗(yàn),使用fisher檢驗(yàn),在R語(yǔ)言中使用fisher.test( )
fisher.test(x, y = NULL, workspace = 200000, hybrid = FALSE,control = list(), or = 1, alternative = "two.sided",conf.int = TRUE, conf.level = 0.95)#其中x是具有二維列聯(lián)表形式的矩陣或是由因子構(gòu)成的對(duì)象,y是由因子構(gòu)成的對(duì)象,當(dāng)x是矩陣時(shí),此值無(wú)效。workspace的輸入值時(shí)一整數(shù),其整數(shù)表示用于網(wǎng)絡(luò)算法空間的大小。hybrid為邏輯變量,FALSE(缺省值)表示精確計(jì)算概率,TRUE表示用混合算法計(jì)算概率。alternative為備擇,有"two.sided"(缺失值)雙邊,"less"單邊小于,"greater"單邊大于,conf.int邏輯變量,當(dāng)conf.int=TRUE(缺省值),給出 區(qū)間估計(jì)。conf.level為置信水平,缺省值為0.95,其余參數(shù)見(jiàn)在線說(shuō)明。R語(yǔ)言代碼:x<-c(4,5,18,6); dim(x)<-c(2,2) fisher.test(x)可見(jiàn)P值>0.05,接受原假設(shè),認(rèn)為兩變量是獨(dú)立的,即兩組新生兒的HBV總體感染率無(wú)差別
例12.某胸科醫(yī)院同時(shí)用甲乙兩種方法測(cè)定202份痰樣本中的抗酸桿菌,結(jié)果如下表所示,問(wèn)甲、乙兩種方法檢出率有無(wú)差異。
解:因?yàn)槭窃谙嗤瑐€(gè)體上進(jìn)行的兩次檢驗(yàn),因此使用McNemar檢驗(yàn),
H0:對(duì)相同痰樣本測(cè)定中,甲乙兩種方法檢出率沒(méi)有差異。在R語(yǔ)言中進(jìn)行McNemar檢驗(yàn)用到函數(shù)mcnemar.test( )mcnemar.test(x, y = NULL, correct = TRUE) #其中x是具有二維列聯(lián)表形式的矩陣或是由因子構(gòu)成的對(duì)象。y是由因子構(gòu)成的對(duì)象,當(dāng)x是矩陣時(shí),此值無(wú)效。correct是邏輯變量,TRUE(缺省值)表示在計(jì)算檢驗(yàn)統(tǒng)計(jì)量時(shí)用連續(xù)修正,FALSE是不用修正。R語(yǔ)言代碼:X<-c(49, 21, 25, 107); dim(X)<-c(2,2) mcnemar.test(X,correct=FALSE)P值> 0.05,不能認(rèn)為兩種檢測(cè)方法有差異。
3.2.3.符號(hào)檢驗(yàn)
例13.聯(lián)合國(guó)人員在世界上66個(gè)大城市的生活花費(fèi)指數(shù)(以紐約市1996年12月為100)按自小至大的次序排列如下(這里北京的指數(shù)為99):66 75 78 80 81 81 82 83 83 83 8384 85 85 86 86 86 86 87 87 88 8888 88 88 89 89 89 89 90 90 91 9191 91 92 93 93 96 96 96 97 99 100101 102 103 103 104 104 104 105 106 109 109110 110 110 111 113 115 116 117 118 155 192 假設(shè)這個(gè)樣品是從世界許多大城市中隨即抽樣得到的。試用符號(hào)檢驗(yàn)分析,北京是在中位數(shù)之上,還是在中位數(shù)之下。解:樣本的中位數(shù)(M)作為城市生活水平的中間值,因此需要檢驗(yàn):H 0 : M ≥ 99, H 1 : M < 99.輸入數(shù)據(jù),作二項(xiàng)檢驗(yàn)。R語(yǔ)言代碼:X <- c(66,75, 78 ,80 ,81 ,81 ,82, 83, 83, 83, 83,84 , 85, 85, 86, 86, 86, 86, 87 ,87, 88, 88,88, 88, 88, 89 ,89, 89, 89, 90 ,90 ,91 ,91,91 ,91, 92, 93, 93, 96, 96, 96, 97, 99, 100,101, 102, 103, 103 ,104, 104, 104 ,105, 106, 109, 109,110 ,110, 110, 111, 113, 115, 116, 117 ,118, 155 ,192)binom.test(sum(X>99), length(X), al="l")在程序中,sum(x>99)表示樣本中大于99的個(gè)數(shù)。al是alternative的縮寫(xiě),"l"是"less"的縮寫(xiě)。計(jì)算出的P值小于0.05,拒絕原假設(shè),也就是說(shuō),北京的生活水平高于世界的中位水平。例14.用兩種不同的飼料養(yǎng)豬,其增重情況如下表所示。試分析兩種飼料養(yǎng)豬有無(wú)顯著差異。
R語(yǔ)言代碼:x<-scan()25 30 28 23 27 35 30 28 32 29 30 30 31 16y<-scan()19 32 21 19 25 31 31 26 30 25 28 31 25 25binom.test(sum(x<y), length(x))sum(x < y)表示樣品X小于樣品Y的個(gè)數(shù)。計(jì)算出P值大于0.05,無(wú)法拒絕原假設(shè),可以認(rèn)為兩種飼料養(yǎng)豬無(wú)顯著差異。
例15.某飲料店為了解顧客對(duì)飲料的愛(ài)好情感,進(jìn)一步改進(jìn)他們的工作,對(duì)顧客喜歡咖啡還是喜歡奶茶,或者兩者同樣愛(ài)好進(jìn)行了調(diào)查,顧客喜歡咖啡超過(guò)奶茶用正號(hào)表示,喜歡奶茶超過(guò)咖啡用負(fù)號(hào)表示,兩者同樣愛(ài)好用0表示。現(xiàn)將調(diào)查的結(jié)果列在下表中。試分析顧客是喜歡咖啡還是喜歡奶茶。
解:根據(jù)題意可檢驗(yàn)如下假設(shè):
H0:顧客喜歡咖啡等于喜歡奶茶; H1:顧客喜歡咖啡超過(guò)奶茶。以上資料中有以人(即6號(hào)顧客)表示對(duì)咖啡和奶茶有同樣愛(ài)好,用0表示,因此在樣本容量中不加計(jì)算,所以實(shí)際上N=12.如果H0假設(shè)為真,那么符合p為1/2的二項(xiàng)分布,如果H1為真,那么顧客喜歡奶茶的人數(shù)小于理論值,al="l",因此用R軟件進(jìn)行計(jì)算,顯著性水平取α = 0.10,R語(yǔ)言代碼:binom.test(3,12,p=1/2, al="l", conf.level = 0.90)可見(jiàn)P值 < 0.1 ,置信區(qū)間也不包括0.5,因此拒絕原假設(shè)人口喜歡咖啡的人超過(guò)喜歡奶茶的人。在符號(hào)檢驗(yàn)法中,只計(jì)算符號(hào)的個(gè)數(shù),而不考慮每個(gè)符號(hào)差所包含的絕對(duì)值的大小,因此常常使用彌補(bǔ)了這個(gè)缺點(diǎn)的wilcoxon符號(hào)秩檢驗(yàn)。3.3.4.符號(hào)秩檢驗(yàn)
例16.假定某電池廠宣稱該廠生產(chǎn)的某種型號(hào)電池壽命的中位數(shù)為140安培小時(shí)。為了檢驗(yàn)改廠生產(chǎn)的電池是否符合其規(guī)定的標(biāo)準(zhǔn),現(xiàn)從新近生產(chǎn)的一批電池中抽取了隨即樣本,并對(duì)這20個(gè)電池的壽命進(jìn)行了測(cè)試,其結(jié)果如下(單位:安培小時(shí)):137.0 140.0 138.3 139.0 144.3 139.1 141.7 137.3 133.5 138.2141.1 139.2 136.5 136.5 135.6 138.0 140.9 140.6 136.3 134.1試用Wilcoxon符號(hào)秩檢驗(yàn)分析該廠生產(chǎn)的電池是否符合其標(biāo)準(zhǔn)。
解:根據(jù)題意假設(shè):H0:電池中位數(shù)M≥ 140安培小時(shí);H1:電池中位數(shù)<140安培小時(shí)。在R語(yǔ)言中進(jìn)行符號(hào)秩檢驗(yàn)可以使用wilcox.test( )wilcox.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, exact = NULL, correct = TRUE,conf.int = FALSE, conf.level = 0.95, ...)其中x,y是觀察數(shù)據(jù)構(gòu)成的數(shù)據(jù)向量。alternative是備擇假設(shè),有單側(cè)檢驗(yàn)和雙側(cè)檢驗(yàn),mu待檢參數(shù),如中位數(shù)M0.paired是邏輯變量,說(shuō)明變量x,y是否為成對(duì)數(shù)據(jù)。exact是邏輯變量,說(shuō)明是否精確計(jì)算P值,當(dāng)樣本量較小時(shí),此參數(shù)起作用,當(dāng)樣本兩較大時(shí),軟件采用正態(tài)分布近似計(jì)算P值。correct是邏輯變量,說(shuō)明是否對(duì)P值的計(jì)算采用連續(xù)性修正,相同秩次較多時(shí),統(tǒng)計(jì)量要校正。conf.int是邏輯變量,說(shuō)明是否給出相應(yīng)的置信區(qū)間。R語(yǔ)言代碼:X<-scan()137.0 140.0 138.3 139.0 144.3 139.1 141.7 137.3 133.5 138.2 141.1 139.2 136.5 136.5 135.6 138.0 140.9 140.6 136.3 134.1wilcox.test(X, mu=140, alternative="less",exact=FALSE,correct=FALSE, conf.int=TRUE)這里V=34是wicoxon的統(tǒng)計(jì)量,P值<0.05,即拒絕原假設(shè),接受備擇假設(shè),中位值小于小于140安培小時(shí)。例17. 為了檢驗(yàn)一種新的復(fù)合肥和原來(lái)使用的肥料相比是否顯著提高了小麥的產(chǎn)量,在一個(gè)農(nóng)場(chǎng)中選擇了10塊田地,每塊等分為兩部分,其中任指定一部分使用新的復(fù)合肥料,另一部分使用原肥料。小麥成熟后稱得各部分小麥產(chǎn)量如下表所示。試用Wilcoxon符號(hào)檢驗(yàn)法檢驗(yàn)新復(fù)合肥是否會(huì)顯著提高小麥的產(chǎn)量,并與符號(hào)檢驗(yàn)作比較(α = 0.05)。解:根據(jù)題意作如下假設(shè):H0:新復(fù)合肥的產(chǎn)量與原肥料的產(chǎn)量相同,H1:新復(fù)合肥的產(chǎn)量高于原肥料的產(chǎn)量。符號(hào)秩檢驗(yàn)R語(yǔ)言代碼:x<-c(459, 367, 303, 392, 310, 342, 421, 446, 430, 412)y<-c(414, 306, 321, 443, 281, 301, 353, 391, 405, 390)wilcox.test(x, y, alternative = "greater", paired = TRUE)可見(jiàn)P值<0.05拒絕原假設(shè),即新復(fù)合肥能顯著提高小麥產(chǎn)量。符號(hào)檢驗(yàn)R語(yǔ)言代碼:x<-c(459, 367, 303, 392, 310, 342, 421, 446, 430, 412)y<-c(414, 306, 321, 443, 281, 301, 353, 391, 405, 390)binom.test(sum(x>y), length(x), alternative = "greater") 用符號(hào)檢驗(yàn)P值>0.05,因此在α = 0.05的水平下,就所給數(shù)據(jù)而言,符號(hào)檢驗(yàn)還不足以區(qū)分兩種化肥對(duì)提高小麥的產(chǎn)量產(chǎn)生差異。例18.今測(cè)得10名非鉛作業(yè)工人和7名鉛作業(yè)工人的血鉛值,如下表所示。試用Wilcoxon秩和檢驗(yàn)分析兩組工人血鉛值有無(wú)差異。
解:進(jìn)行Wilcoxon秩和檢驗(yàn)R語(yǔ)言同樣可以使用wilcox.test( )R語(yǔ)言代碼:x<-c(24, 26, 29, 34, 43, 58, 63, 72, 87, 101)y<-c(82, 87, 97, 121, 164, 208, 213)wilcox.test(x,y,alternative="less",exact=FALSE,correct=FALSE)P值小于0.05,拒絕原假設(shè),即鉛作業(yè)工人血鉛值高于非作業(yè)工人。
例19.某醫(yī)院用某種藥物治療兩型慢性支氣管炎患者共216例,療效由下表所示,試分析該藥物對(duì)兩型慢性支氣管炎的治療是否相同。
解:我們想象各病人的療效用4個(gè)不同的值表示(1表示最好,4表示最差),這樣就可以位這216名排序,因此,可用Wilcoxon秩和檢驗(yàn)來(lái)分析問(wèn)題。R語(yǔ)言代碼:x<-rep(1:4, c(62, 41, 14,11)); y<-rep(1:4, c(20, 37, 16, 15)) wilcox.test(x, y, exact=FALSE)P值<0.05,拒絕原假設(shè),即認(rèn)為該藥物對(duì)兩型慢性支氣管炎的治療是不相同的。因?yàn)閿?shù)據(jù)有結(jié)點(diǎn)存在,故無(wú)法精確計(jì)算P值,其參數(shù)為exact=FALSE。3.3.5.二元數(shù)據(jù)相關(guān)檢驗(yàn)
例20.某種礦石中兩種有用成分A,B,取10個(gè)樣品,每個(gè)樣品中成分A的含量百分?jǐn)?shù)x(%),及B的含量百分?jǐn)?shù)y(%)的數(shù)據(jù)下表所示,對(duì)兩組數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn)。解:進(jìn)行相關(guān)性檢驗(yàn),在R語(yǔ)言中可以使用cor.test( )cor.test(x, y,alternative = c("two.sided", "less", "greater"),method = c("pearson", "kendall", "spearman"),exact = NULL, conf.level = 0.95, ...)#其中x,y是數(shù)據(jù)長(zhǎng)度相同的向量,alternative是備擇假設(shè),缺省值為"two.sided",method是檢驗(yàn)方法,缺省值是Pearson檢驗(yàn),conf.level是置信區(qū)間水平,缺省值為0.95cor.test( )還有另一種使用格式cor.test(formula, data, subset, na.action, ...) #其中formula是公式,形如'~u+v' , 'u', 'v' 必須是具有相同長(zhǎng)度的數(shù)值向量,data是數(shù)據(jù)框,subset是可選擇向量,表示觀察值的子集。假設(shè)此例中兩組數(shù)據(jù)均來(lái)自正態(tài)分布,使用pearson相關(guān)性檢驗(yàn),
R語(yǔ)言代碼:
ore<-data.frame(x=c(67, 54, 72, 64, 39, 22, 58, 43, 46, 34),y=c(24, 15, 23, 19, 16, 11, 20, 16, 17, 13) ) cor.test(ore$x,ore$y)可見(jiàn)P值<0.05,拒絕原假設(shè),認(rèn)為X與Y相關(guān)。例21.一項(xiàng)有六個(gè)人參加表演的競(jìng)賽,有兩人進(jìn)行評(píng)定,評(píng)定結(jié)果用下表所示,試用Spearman秩相關(guān)檢驗(yàn)方法檢驗(yàn)這兩個(gè)評(píng)定員對(duì)等級(jí)評(píng)定有無(wú)相關(guān)關(guān)系。
解:R語(yǔ)言代碼:x<-c(1,2,3,4,5,6); y<-c(6,5,4,3,2,1) cor.test(x, y, method = "spearman")可見(jiàn)P值<0.05,拒絕原假設(shè),認(rèn)為x與y相關(guān),rs=-1,表示這兩個(gè)量是完全負(fù)相關(guān),即兩人的結(jié)論有關(guān)系,但完全相反
總結(jié)
以上是生活随笔為你收集整理的R语言各种假设检验实例整理(常用)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Boom 3D播放器功能详解
- 下一篇: 英文不好到底能不能学会编程?