日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据分析之T检验

發(fā)布時間:2023/12/18 编程问答 52 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据分析之T检验 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

1、定義:

t檢驗,亦稱student t檢驗(Student’s t test),主要用于樣本含量較小(例如n < 30),總體標準差σ未知的正態(tài)分布。 t檢驗是用t分布理論來推論差異發(fā)生的概率,從而比較兩個平均數(shù)的差異是否顯著。它與f檢驗、卡方檢驗并列。來源:百度百科

用于統(tǒng)計量服從正態(tài)分布,但方差未知的情況。

T檢驗分析時,當樣本量較大時,很少考慮T檢驗的使用條件。由中心極限定理可知,只要樣本量足夠大,其樣本均數(shù)的抽樣分布仍然是正態(tài)的。即:只要數(shù)據(jù)分布不是強烈的偏態(tài),一般而言T檢驗都是適用的。當樣本例數(shù)n較小時,一般要求樣本取自正態(tài)本體。

t檢驗的前提是要求樣本服從正態(tài)分布或近似正態(tài)分布,不然可以利用一些變換(取對數(shù)、開根號、倒數(shù)等等)試圖將其轉(zhuǎn)化為服從正態(tài)分布是數(shù)據(jù),如若還是不滿足正態(tài)分布,只能利用非參數(shù)檢驗方法。不過當樣本量大于30的時候,可以認為數(shù)據(jù)近似正態(tài)分布。

2、T檢驗的分類

2.1、單樣本T檢驗

檢驗單個變量的均值與目標值之間是否存在差異,如果總體均值已知,樣本均值與總體均值之間差異顯著性檢驗屬于單樣本t檢驗。

2.1.1 目的

檢驗單樣本的均值是否和已知總體的均值相等(主要用于比較一組數(shù)據(jù)與一個特定數(shù)值之間的差異情況)

2.1.2 要求

  • 總體方差未知,否則就可以利用Z檢驗(也叫U檢驗,就是正態(tài)檢驗)
  • 正態(tài)數(shù)據(jù)或近似正態(tài)

2.1.3 原假設(shè)H0與備擇假設(shè)H1

  • H0:樣本均值與總體均值相等
  • H1:樣本均值與總體均值不等

2.1.4 python 中的單樣本T檢驗 ttest_1samp

from scipy import stats import numpy as npnp.random.seed(7654567) # 保證每次運行都會得到相同結(jié)果 # 均值為5,方差為10 rvs = stats.norm.rvs(loc=5, scale=10, size=(50,2))stats.ttest_1samp(rvs, [1, 2])

返回結(jié)果:
Ttest_1sampResult(statistic=array([ 2.0801775 , 2.44893711]), pvalue=array([ 0.04276084, 0.01795186]))

分別顯示兩列數(shù)的t統(tǒng)計量和p值。由p值分別為0.042和0.018,當p值小于0.05時,認為差異顯著,即第一列數(shù)的均值不等于1,第二列數(shù)的均值不等于2。

  • 不拒絕原假設(shè)——均值等于5
stats.ttest_1samp(rvs, 5.0) Ttest_1sampResult(statistic=array([-0.68014479, -0.04323899]), pvalue=array([ 0.49961383, 0.96568674]))
  • 拒絕原假設(shè)——均值不等于5
stats.ttest_1samp(rvs, 0.0) Ttest_1sampResult(statistic=array([ 2.77025808, 4.11038784]), pvalue=array([ 0.00789095, 0.00014999]))
  • 第一列數(shù)均值等于5,第二列數(shù)均值不等于0
stats.ttest_1samp(rvs,[5.0,0.0]) Ttest_1sampResult(statistic=array([-0.68014479, 4.11038784]), pvalue=array([ 4.99613833e-01, 1.49986458e-04]))
  • 第一行數(shù)均值等于5,第二行數(shù)均值不等于0
#axis=0按列運算,axis=1按行運算 stats.ttest_1samp(rvs.T,[5.0,0.0],axis=1)
  • 將兩列數(shù)據(jù)均值分別與5.0和0.0比較,得到4個t統(tǒng)計量和p值
stats.ttest_1samp(rvs,[[5.0],[0.0]]) Ttest_1sampResult(statistic=array([[-0.68014479, -0.04323899],[ 2.77025808, 4.11038784]]), pvalue=array([[ 4.99613833e-01, 9.65686743e-01],[ 7.89094663e-03, 1.49986458e-04]]))

————————————————
原文鏈接:https://blog.csdn.net/m0_37777649/article/details/74938120

2.1.5 補充:檢驗原理


————————————————
原文鏈接:https://zhuanlan.zhihu.com/p/138711532

2.2 獨立樣本t檢驗

用于檢驗兩組服從正態(tài)分布的總體均值是否一樣,前提是兩個樣本方差相等。如果兩組樣本彼此不獨立,應(yīng)該使用配對樣本t檢驗。

2.2.1 目的

檢驗兩獨立樣本的均值是否相等。

2.2.2 要求

兩樣本獨立,服從正態(tài)分布或近似正態(tài)。

2.2.3 根據(jù)總體方差是否相等可以分為兩類

2.2.3.1 總體方差相等且未知 樣本方差滿足


2.3.3.2 總體方差不等且未知(或者對它們一無所知)滿足

2.3.3.3 檢驗原理(方差相等或不等都適用)


————————————————
原文鏈接:https://zhuanlan.zhihu.com/p/138711532

2.2.4 python中的獨立樣本T檢驗 ttest_ind

from scipy import stats import numpy as npnp.random.seed(12345678) #loc:平均值 scale:方差 rvs1 = stats.norm.rvs(loc=5,scale=10,size=500) rvs2 = stats.norm.rvs(loc=5,scale=10,size=500)


  • 當兩總體方差相等時,即具有“方差齊性”,可以直接檢驗
    • 不拒絕原假設(shè)——兩總體均值相等
    stats.ttest_ind(rvs1,rvs2, equal_var = True) LeveneResult(statistic=0.9775501222315258, pvalue=0.323044034693146)
    • 如果兩總體具有方差齊性,錯將equal_var設(shè)為False,p值變大
    stats.ttest_ind(rvs1,rvs2, equal_var = False) Ttest_indResult(statistic=0.26833823296238857, pvalue=0.78849452749501059)
  • 當不確定兩總體方差是否相等時,應(yīng)先利用levene檢驗,檢驗兩總體是否具有方差齊性。
  • stats.levene(rvs1, rvs2) LeveneResult(statistic=1.0117186648494396, pvalue=0.31473525853990908)

    p值遠大于0.05,認為兩總體具有方差齊性。

    如果兩總體不具有方差齊性,需要將equal_val參數(shù)設(shè)定為“False”。這里設(shè)置成False則進行Welch’s t-test而不是Student’s t-test

    注:

    • 兩總體方差不等時,若沒有將equal_var參數(shù)設(shè)定為False,則函數(shù)會默認equal_var為True,這樣會低估p值
    rvs3 = stats.norm.rvs(loc=5, scale=20, size=500) stats.ttest_ind(rvs1, rvs3) Ttest_indResult(statistic=-0.5189533606202925, pvalue=0.6039083183389862)
    • 正確的P值
    rvs3 = stats.norm.rvs(loc=5, scale=20, size=500) stats.ttest_ind(rvs1, rvs3, equal_var = False) Ttest_indResult(statistic=0.8518907349603478, pvalue=0.39455490418122585)

    2.3、配對樣本t檢驗

    用于兩個樣本并不互相獨立,對兩個總體的均值差異進行檢驗,原假設(shè)d=μ1-μ2=0,即假定兩個總體均值相等

    2.3.1 目的

    分析配對定量數(shù)據(jù)之間的差異對比關(guān)系

    2.3.2 要求

    • 總體方差相等
    • 正態(tài)數(shù)據(jù)或近似正態(tài)
    • 兩個樣本的樣本量要相同,樣本先后的順序是一一對應(yīng)的。

    2.3.3 檢驗原理


    ————————————————
    原文鏈接:https://zhuanlan.zhihu.com/p/138711532

    2.3.4 python 中的配對樣本T檢驗 ttest_rel

    from scipy import stats import numpy as nprvs1 = stats.norm.rvs(loc=5,scale=10,size=500) rvs2 = (stats.norm.rvs(loc=5,scale=10,size=500) + stats.norm.rvs(scale=0.2,size=500)) rvs3 = (stats.norm.rvs(loc=8,scale=10,size=500) + stats.norm.rvs(scale=0.2,size=500))
    • 不拒絕原假設(shè),認為rvs1 與 rvs2 所代表的總體均值相等
    stats.ttest_rel(rvs1,rvs2) Ttest_relResult(statistic=0.24101764965300979, pvalue=0.8096404344581155)
    • 拒絕原假設(shè),認為rvs1 與 rvs3所代表的總體均值不相等
    stats.ttest_rel(rvs1,rvs3) Ttest_relResult(statistic=-3.9995108708727924, pvalue=7.308240219166128e-05)

    2.4 配對T檢驗與獨立T檢驗

    兩者的主要區(qū)別在于:配對樣本t檢驗需要兩組樣本數(shù)相等,且要求每對配對數(shù)據(jù)之間要有一定的對應(yīng)關(guān)系,而獨立樣本t檢驗兩組數(shù)據(jù)的樣本個數(shù)可以不等

    • 常見的配對研究包括幾種情況:

    • 無論是哪種T檢驗,都要數(shù)據(jù)服從正態(tài)或近似正態(tài)分布。

      正態(tài)性有多種檢驗方法,常見方法如:正態(tài)圖、正態(tài)性檢驗、P-P圖/Q-Q圖等。

      正態(tài)性檢驗可查看之前的文章:數(shù)據(jù)分析之正態(tài)性檢驗(女人近我三尺便是向我問劍)

    • 非正態(tài)時處理方法

      若數(shù)據(jù)滿足正態(tài)性則不用考慮此步,直接選擇對應(yīng)方法分析。
      若不滿足,則可考慮使用非參數(shù)檢驗,三種T檢驗對應(yīng)的不同的處理方法,具體說明如下:

      從功能上講,它們的區(qū)別僅在于數(shù)據(jù)是否正態(tài)。除此之外,非參數(shù)檢驗的檢驗效率不如參數(shù)檢驗,因而在實際研究中,可能即使數(shù)據(jù)非正態(tài),也會使用基于正態(tài)分布的參數(shù)檢驗。

    • 對于獨立樣本t檢驗,除了要滿足正態(tài)性,還需要滿足方差齊的前提條件。即方差齊的情況下,才可以使用t檢驗。如果方差不齊,則應(yīng)采用校正T檢驗。

    在spss軟件中,會分別輸出方差相等與不相等時T檢驗的結(jié)果,如通過Levene’s檢驗結(jié)果即p>0.05,則說明兩組數(shù)據(jù)方差齊。
    上圖中只有③喜歡產(chǎn)品這一變量不滿足方差齊條件,因此應(yīng)該使用校正t檢驗,也就是看方差不相等時的結(jié)果。

    • 無論配對t檢驗還是獨立樣本t檢驗,都只適用于兩組數(shù)據(jù)的對比,如果數(shù)據(jù)超過兩組,需要使用方差分析

    參考鏈接:T檢驗分析思路完整總結(jié),來看!

    用SPSS進行T檢驗:
    參數(shù)檢驗(一):為什么SPSS沒有Z檢驗
    參數(shù)檢驗(二):t檢驗的介紹與單樣本t檢驗的SPSS操作
    參數(shù)檢驗(三):獨立樣本和配對樣本t檢驗的SPSS操作

    其他T檢驗相關(guān):
    如何理解Z檢驗和T檢驗?
    利用python進行T檢驗

    待續(xù)。。。

    總結(jié)

    以上是生活随笔為你收集整理的数据分析之T检验的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。