當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据分析之T检验

發(fā)布時間：2023/12/18 编程问答 52 豆豆

生活随笔收集整理的這篇文章主要介紹了数据分析之T检验小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1、定義：

t檢驗，亦稱student t檢驗（Student’s t test），主要用于樣本含量較小（例如n < 30），總體標準差σ未知的正態(tài)分布。 t檢驗是用t分布理論來推論差異發(fā)生的概率，從而比較兩個平均數(shù)的差異是否顯著。它與f檢驗、卡方檢驗并列。來源：百度百科

用于統(tǒng)計量服從正態(tài)分布，但方差未知的情況。

T檢驗分析時，當樣本量較大時，很少考慮T檢驗的使用條件。由中心極限定理可知，只要樣本量足夠大，其樣本均數(shù)的抽樣分布仍然是正態(tài)的。即：只要數(shù)據(jù)分布不是強烈的偏態(tài)，一般而言T檢驗都是適用的。當樣本例數(shù)n較小時，一般要求樣本取自正態(tài)本體。

t檢驗的前提是要求樣本服從正態(tài)分布或近似正態(tài)分布，不然可以利用一些變換（取對數(shù)、開根號、倒數(shù)等等）試圖將其轉(zhuǎn)化為服從正態(tài)分布是數(shù)據(jù)，如若還是不滿足正態(tài)分布，只能利用非參數(shù)檢驗方法。不過當樣本量大于30的時候，可以認為數(shù)據(jù)近似正態(tài)分布。

2、T檢驗的分類

2.1、單樣本T檢驗

檢驗單個變量的均值與目標值之間是否存在差異，如果總體均值已知，樣本均值與總體均值之間差異顯著性檢驗屬于單樣本t檢驗。

2.1.1 目的

檢驗單樣本的均值是否和已知總體的均值相等（主要用于比較一組數(shù)據(jù)與一個特定數(shù)值之間的差異情況）

2.1.2 要求

總體方差未知，否則就可以利用Z檢驗（也叫U檢驗，就是正態(tài)檢驗）
正態(tài)數(shù)據(jù)或近似正態(tài)

2.1.3 原假設(shè)H0與備擇假設(shè)H1

H0：樣本均值與總體均值相等
H1：樣本均值與總體均值不等

2.1.4 python 中的單樣本T檢驗 ttest_1samp

from scipy import stats import numpy as npnp.random.seed(7654567) # 保證每次運行都會得到相同結(jié)果 # 均值為5，方差為10 rvs = stats.norm.rvs(loc=5, scale=10, size=(50,2))stats.ttest_1samp(rvs, [1, 2])

返回結(jié)果：
Ttest_1sampResult(statistic=array([ 2.0801775 , 2.44893711]), pvalue=array([ 0.04276084, 0.01795186]))

分別顯示兩列數(shù)的t統(tǒng)計量和p值。由p值分別為0.042和0.018，當p值小于0.05時，認為差異顯著，即第一列數(shù)的均值不等于1，第二列數(shù)的均值不等于2。

不拒絕原假設(shè)——均值等于5

stats.ttest_1samp(rvs, 5.0) Ttest_1sampResult(statistic=array([-0.68014479, -0.04323899]), pvalue=array([ 0.49961383, 0.96568674]))

拒絕原假設(shè)——均值不等于5

stats.ttest_1samp(rvs, 0.0) Ttest_1sampResult(statistic=array([ 2.77025808, 4.11038784]), pvalue=array([ 0.00789095, 0.00014999]))

第一列數(shù)均值等于5，第二列數(shù)均值不等于0

stats.ttest_1samp(rvs,[5.0,0.0]) Ttest_1sampResult(statistic=array([-0.68014479, 4.11038784]), pvalue=array([ 4.99613833e-01, 1.49986458e-04]))

第一行數(shù)均值等于5，第二行數(shù)均值不等于0

#axis=0按列運算，axis=1按行運算 stats.ttest_1samp(rvs.T,[5.0,0.0],axis=1)

將兩列數(shù)據(jù)均值分別與5.0和0.0比較，得到4個t統(tǒng)計量和p值

stats.ttest_1samp(rvs,[[5.0],[0.0]]) Ttest_1sampResult(statistic=array([[-0.68014479, -0.04323899],[ 2.77025808, 4.11038784]]), pvalue=array([[ 4.99613833e-01, 9.65686743e-01],[ 7.89094663e-03, 1.49986458e-04]]))

————————————————
原文鏈接：https://blog.csdn.net/m0_37777649/article/details/74938120

2.1.5 補充：檢驗原理

————————————————
原文鏈接：https://zhuanlan.zhihu.com/p/138711532

2.2 獨立樣本t檢驗

用于檢驗兩組服從正態(tài)分布的總體均值是否一樣，前提是兩個樣本方差相等。如果兩組樣本彼此不獨立，應(yīng)該使用配對樣本t檢驗。

2.2.1 目的

檢驗兩獨立樣本的均值是否相等。

2.2.2 要求

兩樣本獨立，服從正態(tài)分布或近似正態(tài)。

2.2.3 根據(jù)總體方差是否相等可以分為兩類

2.2.3.1 總體方差相等且未知樣本方差滿足

2.3.3.2 總體方差不等且未知（或者對它們一無所知）滿足

2.3.3.3 檢驗原理（方差相等或不等都適用）

————————————————
原文鏈接：https://zhuanlan.zhihu.com/p/138711532

2.2.4 python中的獨立樣本T檢驗 ttest_ind

from scipy import stats import numpy as npnp.random.seed(12345678) #loc:平均值 scale：方差 rvs1 = stats.norm.rvs(loc=5,scale=10,size=500) rvs2 = stats.norm.rvs(loc=5,scale=10,size=500)

當兩總體方差相等時，即具有“方差齊性”，可以直接檢驗

不拒絕原假設(shè)——兩總體均值相等

stats.ttest_ind(rvs1,rvs2, equal_var = True) LeveneResult(statistic=0.9775501222315258, pvalue=0.323044034693146)

如果兩總體具有方差齊性，錯將equal_var設(shè)為False，p值變大

stats.ttest_ind(rvs1,rvs2, equal_var = False) Ttest_indResult(statistic=0.26833823296238857, pvalue=0.78849452749501059)

當不確定兩總體方差是否相等時，應(yīng)先利用levene檢驗，檢驗兩總體是否具有方差齊性。

stats.levene(rvs1, rvs2) LeveneResult(statistic=1.0117186648494396, pvalue=0.31473525853990908)

p值遠大于0.05，認為兩總體具有方差齊性。

如果兩總體不具有方差齊性，需要將equal_val參數(shù)設(shè)定為“False”。這里設(shè)置成False則進行Welch’s t-test而不是Student’s t-test

注：

兩總體方差不等時，若沒有將equal_var參數(shù)設(shè)定為False，則函數(shù)會默認equal_var為True，這樣會低估p值

rvs3 = stats.norm.rvs(loc=5, scale=20, size=500) stats.ttest_ind(rvs1, rvs3) Ttest_indResult(statistic=-0.5189533606202925, pvalue=0.6039083183389862)

正確的P值

rvs3 = stats.norm.rvs(loc=5, scale=20, size=500) stats.ttest_ind(rvs1, rvs3, equal_var = False) Ttest_indResult(statistic=0.8518907349603478, pvalue=0.39455490418122585)

2.3、配對樣本t檢驗

用于兩個樣本并不互相獨立，對兩個總體的均值差異進行檢驗，原假設(shè)d=μ1-μ2=0，即假定兩個總體均值相等

2.3.1 目的

分析配對定量數(shù)據(jù)之間的差異對比關(guān)系

2.3.2 要求

總體方差相等
正態(tài)數(shù)據(jù)或近似正態(tài)
兩個樣本的樣本量要相同，樣本先后的順序是一一對應(yīng)的。

2.3.3 檢驗原理

————————————————
原文鏈接：https://zhuanlan.zhihu.com/p/138711532

2.3.4 python 中的配對樣本T檢驗 ttest_rel

from scipy import stats import numpy as nprvs1 = stats.norm.rvs(loc=5,scale=10,size=500) rvs2 = (stats.norm.rvs(loc=5,scale=10,size=500) + stats.norm.rvs(scale=0.2,size=500)) rvs3 = (stats.norm.rvs(loc=8,scale=10,size=500) + stats.norm.rvs(scale=0.2,size=500))

不拒絕原假設(shè)，認為rvs1 與 rvs2 所代表的總體均值相等

stats.ttest_rel(rvs1,rvs2) Ttest_relResult(statistic=0.24101764965300979, pvalue=0.8096404344581155)

拒絕原假設(shè)，認為rvs1 與 rvs3所代表的總體均值不相等

stats.ttest_rel(rvs1,rvs3) Ttest_relResult(statistic=-3.9995108708727924, pvalue=7.308240219166128e-05)

2.4 配對T檢驗與獨立T檢驗

兩者的主要區(qū)別在于：配對樣本t檢驗需要兩組樣本數(shù)相等，且要求每對配對數(shù)據(jù)之間要有一定的對應(yīng)關(guān)系，而獨立樣本t檢驗兩組數(shù)據(jù)的樣本個數(shù)可以不等

常見的配對研究包括幾種情況：
無論是哪種T檢驗，都要數(shù)據(jù)服從正態(tài)或近似正態(tài)分布。

正態(tài)性有多種檢驗方法，常見方法如：正態(tài)圖、正態(tài)性檢驗、P-P圖/Q-Q圖等。

正態(tài)性檢驗可查看之前的文章：數(shù)據(jù)分析之正態(tài)性檢驗（女人近我三尺便是向我問劍）
非正態(tài)時處理方法

若數(shù)據(jù)滿足正態(tài)性則不用考慮此步，直接選擇對應(yīng)方法分析。
若不滿足，則可考慮使用非參數(shù)檢驗，三種T檢驗對應(yīng)的不同的處理方法，具體說明如下：

從功能上講，它們的區(qū)別僅在于數(shù)據(jù)是否正態(tài)。除此之外，非參數(shù)檢驗的檢驗效率不如參數(shù)檢驗，因而在實際研究中，可能即使數(shù)據(jù)非正態(tài)，也會使用基于正態(tài)分布的參數(shù)檢驗。
對于獨立樣本t檢驗，除了要滿足正態(tài)性，還需要滿足方差齊的前提條件。即方差齊的情況下，才可以使用t檢驗。如果方差不齊，則應(yīng)采用校正T檢驗。

在spss軟件中，會分別輸出方差相等與不相等時T檢驗的結(jié)果，如通過Levene’s檢驗結(jié)果即p>0.05，則說明兩組數(shù)據(jù)方差齊。
上圖中只有③喜歡產(chǎn)品這一變量不滿足方差齊條件，因此應(yīng)該使用校正t檢驗，也就是看方差不相等時的結(jié)果。

無論配對t檢驗還是獨立樣本t檢驗，都只適用于兩組數(shù)據(jù)的對比，如果數(shù)據(jù)超過兩組，需要使用方差分析

參考鏈接：T檢驗分析思路完整總結(jié)，來看！

用SPSS進行T檢驗：
參數(shù)檢驗（一）：為什么SPSS沒有Z檢驗
參數(shù)檢驗（二）：t檢驗的介紹與單樣本t檢驗的SPSS操作
參數(shù)檢驗（三）：獨立樣本和配對樣本t檢驗的SPSS操作

其他T檢驗相關(guān)：
如何理解Z檢驗和T檢驗？
利用python進行T檢驗

待續(xù)。。。

總結(jié)

以上是生活随笔為你收集整理的数据分析之T检验的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

数据

上一篇： ssh: Could not resol
下一篇：图文详解：微信公众号申请流程

编程问答

数据分析之T检验

1、定義：

2、T檢驗的分類

2.1、單樣本T檢驗

2.1.1 目的

2.1.2 要求

2.1.3 原假設(shè)H0與備擇假設(shè)H1

2.1.4 python 中的單樣本T檢驗 ttest_1samp

2.1.5 補充：檢驗原理

2.2 獨立樣本t檢驗

2.2.1 目的

2.2.2 要求

2.2.3 根據(jù)總體方差是否相等可以分為兩類

2.2.3.1 總體方差相等且未知 樣本方差滿足

2.3.3.2 總體方差不等且未知（或者對它們一無所知）滿足

2.3.3.3 檢驗原理（方差相等或不等都適用）

2.2.4 python中的獨立樣本T檢驗 ttest_ind

2.3、配對樣本t檢驗

2.3.1 目的

2.3.2 要求

2.3.3 檢驗原理

2.3.4 python 中的配對樣本T檢驗 ttest_rel

2.4 配對T檢驗與獨立T檢驗

待續(xù)。。。

總結(jié)

2.2.3.1 總體方差相等且未知樣本方差滿足