日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

datagrid出现相同两组数据_数据分析之统计学

發(fā)布時(shí)間:2024/9/19 编程问答 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 datagrid出现相同两组数据_数据分析之统计学 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

統(tǒng)計(jì)學(xué)知識

  • 思維導(dǎo)圖

第一節(jié) 統(tǒng)計(jì)學(xué)基本原理

  • 數(shù)據(jù)分析相關(guān)概念

一、描述統(tǒng)計(jì)

  • 測量尺度
  • 1.定類(nominal)

    功能:分類的作用,比如性別

    2.定序(ordinal)

    功能:分類、排序的作用,比如最想去的國家

    3.定距(scale)

    功能:分類、排序、加減,比如溫度

    4.定比(scale)

    功能:分類、排序、加減、乘除,比如年齡

    定類與定序合并成分類變量,定距與定比合并成連續(xù)變量。

    分類變量的描述統(tǒng)計(jì)方法只能用頻次統(tǒng)計(jì),對于連續(xù)變量既可以用頻次統(tǒng)計(jì)也可以用均值和標(biāo)準(zhǔn)差。

  • 均值
  • 1.算數(shù)平均

    2.幾何平均

    3.調(diào)和平均

    可能用在數(shù)據(jù)中較多數(shù)值集中在最小值附近,原因可能是因?yàn)檎{(diào)和平均相對于算數(shù)、幾何平均最小。

    4.調(diào)整平均

    去掉上限值或者下限值,比例一般為5%

  • 中位數(shù)和眾數(shù)
  • 1.中位數(shù):

    當(dāng)一組序列數(shù)據(jù)之間差異較大時(shí),導(dǎo)致平均值代表性較弱,可通過中位數(shù)來表示數(shù)據(jù)的集中趨勢。

    平均值、中位數(shù)通常應(yīng)用在連續(xù)變量中,即數(shù)值型變量;

    眾數(shù)既可以應(yīng)用在連續(xù)變量也可以應(yīng)用在分類變量。

  • 極差和方差、標(biāo)準(zhǔn)差
  • 衡量離散趨勢,數(shù)據(jù)離散趨勢代表了數(shù)據(jù)中包含的信息量。

    1.標(biāo)準(zhǔn)差

    標(biāo)準(zhǔn)差計(jì)算公式中,有的除以n,有的除以n-1;

    當(dāng)計(jì)算總體數(shù)據(jù)標(biāo)準(zhǔn)差時(shí),除以n,

    通過樣本數(shù)據(jù)計(jì)算總體標(biāo)準(zhǔn)差時(shí),除以n-1;

    原因是人為增大標(biāo)準(zhǔn)差以提高代表性。

    2.離散趨勢

    如果希望比較兩組數(shù)據(jù)的離散趨勢,不能直接比較兩組數(shù)據(jù)的標(biāo)準(zhǔn)差,因?yàn)閮山M數(shù)據(jù)的樣本量和均值不同。通常選用離散系數(shù)來進(jìn)行比較,離散系數(shù)=標(biāo)準(zhǔn)差/平均值

    二、總體推斷/假設(shè)檢驗(yàn)

    1.Z值轉(zhuǎn)換公式

    Z=(xi-x)/s

    用來將t分布轉(zhuǎn)換為(0,1)z分布,又稱為標(biāo)準(zhǔn)化,或者叫Z值標(biāo)準(zhǔn)化;用于判斷哪些數(shù)值為異常值,|Z值|>3為異常值,|Z值|>5為極端值。

    2.置信度

    T=1.65 對應(yīng)90%的置信度

    T=1.98 對應(yīng)95%的置信度

    T=2.58 對應(yīng)99%的置信度

    3.假設(shè)檢驗(yàn)

    步驟:

  • 定義H0和H1,H0通常定義兩個(gè)變量之間么有顯著差異
  • 選擇合適的檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量(t值、F值、Z值、卡方值)
  • 根據(jù)統(tǒng)計(jì)量計(jì)算概率P值
  • P值與顯著性水平5%對比;
  • P<5%,則拒絕原假設(shè)H0,接受研究假設(shè)H1;

    P>5%,則接受原假設(shè)H0,拒絕研究假設(shè)H1。

    三、抽樣方法

    1、分層抽樣

    如何讓選擇分層變量

  • 選擇那些與研究主題高度相關(guān)的變量;比如研究收入問題時(shí),考慮學(xué)歷、年齡、性別等影響收入的基本屬性。
  • 成本:分層因素考慮越多,選取的樣本量則會越多;學(xué)歷(分為高中低3類)、收入(分為高中低3類)、性別(男女2類),總共18類,每類樣本量至少保證30人以上,18*30=540人;與研究主題不太相關(guān)的主題可以不考慮,或者將因素的分類減少。
  • 四、卡方檢驗(yàn)

    假設(shè)檢驗(yàn)的結(jié)論:

    p>0.05,則原假設(shè)成立,研究假設(shè)不成立;

    P<0.05,則原假設(shè)不成立,研究假設(shè)成立。

    1.卡方檢驗(yàn)的重要性

    適用于不知道總體參數(shù)的檢驗(yàn),是最常用的一種非參數(shù)檢驗(yàn)。

    當(dāng)不適用于參數(shù)檢驗(yàn)法的時(shí)候,第一個(gè)想到的就是卡方檢驗(yàn)。

    2.卡方檢驗(yàn)的應(yīng)用場景

  • 比例分布檢驗(yàn)
  • 檢驗(yàn)一個(gè)變量中取值的比例分布是否相等,或者是否符合設(shè)定的比例分布

    原假設(shè):變量的取值分布與均勻分布(研究者設(shè)定的分布)沒有顯著差異

    研究假設(shè):變量的取值分布與均勻分布(研究者設(shè)定的分布)有顯著差異

    SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-卡方

  • 二項(xiàng)式檢驗(yàn)
  • 檢驗(yàn)一個(gè)變量取二分類兩個(gè)值的概率是否符合設(shè)定的概率

    原假設(shè):變量的第一個(gè)取值比例與設(shè)定比例沒有顯著差異。

    研究假設(shè):變量的第一個(gè)取值與設(shè)定比例有顯著差異。

    SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-二項(xiàng)

    • 分割點(diǎn):是將一個(gè)連續(xù)變量,選擇一個(gè)值作為分割點(diǎn)
  • K-S檢驗(yàn)
  • 檢驗(yàn)樣本來自的總體中,一個(gè)變量的分布是否服從正態(tài)分布、均勻分布、泊松分布、指數(shù)分布

    原假設(shè):變量來自總體的分布與正態(tài)分布(均勻分布等)沒有顯著差異,即變量在總體中呈現(xiàn)正態(tài)分布(或均勻分布等)。

    研究假設(shè):變量來自總體的分布與正態(tài)分布(均勻分布等)有顯著差異,即變量在總體中不呈現(xiàn)正態(tài)分布(或均勻分布等)。

    SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-單樣本K-S

  • 游程檢驗(yàn)
  • 檢驗(yàn)一個(gè)變量的兩個(gè)取值的出現(xiàn)順序是否隨機(jī)。兩個(gè)值出現(xiàn)比例各占50%。

    檢驗(yàn)場景:通常是檢驗(yàn)隨著時(shí)間變化而產(chǎn)生的兩個(gè)數(shù)值,出現(xiàn)順序是否隨機(jī)。

    原假設(shè):變量的兩個(gè)值的出現(xiàn)順序和隨機(jī)出現(xiàn)沒有顯著差異。

    研究假設(shè):變量的兩個(gè)值的出現(xiàn)順序不是隨機(jī)的。

    SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-游程檢驗(yàn)

  • 獨(dú)立樣本非參數(shù)檢驗(yàn)
  • 獨(dú)立樣本:兩組不重疊的樣本,檢驗(yàn)不同人群在特定變量在取值上是否有差異;

    比如男性和女性在收入分布上是否有差異。

    原假設(shè):兩組來自總體的變量數(shù)據(jù)在分布上沒有顯著差異,即兩組數(shù)據(jù)在該變量的取值上沒有顯著差異。

    研究假設(shè):兩組來自總體的變量數(shù)據(jù)在分布上有顯著差異,即兩組數(shù)據(jù)在該變量的取值上有顯著差異。

    注意:分組變量是分類變量,比較變量是連續(xù)變量

    SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-2個(gè)獨(dú)立樣本

  • 配對樣本非參數(shù)檢驗(yàn)
  • 配對樣本:同一組人群不同時(shí)間采集的兩組或多組數(shù)據(jù),或者同一組人群不同身體部位所采集的兩組或多組數(shù)據(jù)。

    檢驗(yàn)同一組人群在不同時(shí)間、不用部位采集的數(shù)據(jù)是否有差異。

    原假設(shè):來自總體的同一組人群的兩組數(shù)據(jù)在分布上沒有顯著差異,即兩組數(shù)據(jù)在該變量的取值上沒有顯著差異。

    研究假設(shè):來自總體的同一組人群的兩組數(shù)據(jù)在分布上有顯著差異,即兩組數(shù)據(jù)在該變量的取值上有顯著差異。

    注意:t1、t2,比較的變量必須是連續(xù)變量

    SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-2個(gè)相關(guān)樣本

  • 交叉分析(列聯(lián)表分析)
  • 檢驗(yàn)兩個(gè)分類變量(定類和定序)是否有相關(guān)性。

    如果場景中需要對連續(xù)變量進(jìn)行卡方檢驗(yàn),首先需要將連續(xù)變量轉(zhuǎn)換為分類變量;如年齡分成70后、80后、90后、00后。

    SPSS操作:分析-描述統(tǒng)計(jì)-交叉表

    • 連續(xù)變量轉(zhuǎn)換成分類變量的操作:轉(zhuǎn)換-重新編碼為不同變量,收入分為0-50,51-400,401及以上
    • 如果兩個(gè)變量都是定類變量,相關(guān)系數(shù)可通過卡方檢驗(yàn)中“名義”里的4個(gè)相關(guān)系數(shù);如果兩個(gè)變量都是定序變量,則選擇“有序”里的4個(gè)相關(guān)系數(shù)。
    • 問:如果兩個(gè)變量中,一個(gè)為定類變量,一個(gè)為定序變量,相關(guān)系數(shù)應(yīng)該選哪個(gè)?

    答;應(yīng)該選“名義”中的4個(gè)相關(guān)系數(shù)。原因是定序變量可以降級為定類變量,而定類變量不可以升級為定序變量。

    • 卡方檢驗(yàn)結(jié)果解讀:

    第一步:看卡方統(tǒng)計(jì)結(jié)果,根據(jù)P值判斷兩個(gè)變量是否存在相關(guān)性;如p<0.05,則說明兩者存在顯著相關(guān)性。

    第二步:看相關(guān)系數(shù),判斷兩者之間相關(guān)性到底有多大。

    • 0-0.2,較弱相關(guān);
    • 0.2-0.4,弱相關(guān);
    • 0.4-0.6,相關(guān)性一般;
    • 0.6-0.8,弱強(qiáng)相關(guān);
    • 0.8-1,極強(qiáng)相關(guān)。

    第三步:看頻次分布,具體分析兩者存在什么樣的相關(guān)。

    五、t檢驗(yàn)、方差檢驗(yàn)

    1.t檢驗(yàn)

  • 單樣本t檢驗(yàn)
  • 用來檢驗(yàn)樣本中某個(gè)連續(xù)變量的均值與給定的總體均值是否存在差異。

    用到的變量:一個(gè)連續(xù)變量。

    原假設(shè):樣本所來自總體的均值與給定的均值之間沒有顯著差異。

    研究假設(shè):樣本所來自總體的均值與給定的均值之間有顯著差異。

    SPSS操作:分析-比較平均值-單樣本T檢驗(yàn)

  • 獨(dú)立樣本t檢驗(yàn)
  • 用來檢驗(yàn)兩組獨(dú)立樣本在某個(gè)連續(xù)變量的均值是否有顯著差異。

    用到的變量:一個(gè)連續(xù)變量和一個(gè)分類變量(也可以將連續(xù)變量進(jìn)行分組得到一個(gè)分類變量)。

    原假設(shè):樣本所來自總體的均值與給定的均值之間沒有顯著差異。

    研究假設(shè):樣本所來自總體的均值與給定的均值之間有顯著差異。

    SPSS操作:分析-比較平均值-獨(dú)立樣本T檢驗(yàn)

    方差齊性檢驗(yàn)

    原假設(shè):兩組總體中的方差是相等的(沒有差異的)。

    研究假設(shè):兩組總體中的方差是不相等的(有差異的)。

    當(dāng)p>0.05時(shí),原假設(shè)成立;即兩組總體中的方差是相等的,需要看第一行的t值檢驗(yàn)結(jié)果。反之則看第二行的t值檢驗(yàn)結(jié)果。

  • 配對樣本t檢驗(yàn)
  • 用來檢驗(yàn)同一樣本不同時(shí)間/部位/處理?xiàng)l件測量得到的兩組數(shù)據(jù)均值是否存在差異。

    原假設(shè):樣本所來自總體的均值與給定的均值之間沒有顯著差異。

    研究假設(shè):樣本所來自總體的均值與給定的均值之間有顯著差異。

    變量:兩個(gè)人連續(xù)變量(其實(shí)是針對同一組人群不同時(shí)間/處理部位/條件測量的兩組數(shù)據(jù))

    SPSS操作:分析-比較平均值-成對樣本t檢驗(yàn)

    2.方差檢驗(yàn)

    變量:變量既可以是分類也可以是連續(xù)變量,因變量必須是連續(xù)變量

  • 單因素方差檢驗(yàn)
  • 檢驗(yàn)3組人群及以上在某個(gè)連續(xù)變量均值上是否存在差異,或某個(gè)分類變量對連續(xù)變量是否存在顯著相關(guān)。

    變量:自變量為一個(gè),是分類變量;因變量是一個(gè),且為連續(xù)變量。

    原假設(shè):不同人群之間在該連續(xù)變量的均值沒有顯著差異(自變量與因變量之間不存在顯著相關(guān))

    研究假設(shè):不同人群之間在該連續(xù)變量的均值有顯著差異(自變量與因變量之間存在顯著相關(guān))

    SPSS操作:分析-比較平均值-單因素ANOVA檢驗(yàn)

    • 兩兩比較中根據(jù)方差齊性檢驗(yàn)結(jié)果,來選擇方差相等的比較結(jié)果或方差不等的檢驗(yàn)結(jié)果。
    • 方差齊性檢驗(yàn):“選項(xiàng)”中-勾選“方差齊性檢驗(yàn)”。當(dāng)方差不齊時(shí),則通過非參數(shù)檢驗(yàn)中的K個(gè)獨(dú)立樣本檢驗(yàn)法進(jìn)行檢驗(yàn)。
  • 多因素方差檢驗(yàn)
  • 檢驗(yàn)多個(gè)變量在某個(gè)連續(xù)變量均值上是否存在差異,或多個(gè)變量對連續(xù)變量是否存在顯著相關(guān)。

    變量:自變量為多個(gè),既可以是分類變量也可以是連續(xù)變量;因變量是一個(gè),且為連續(xù)變量。

    原假設(shè):多個(gè)自變量與因變量之間不存在顯著相關(guān)

    研究假設(shè):多個(gè)自變量與因變量之間存在顯著相關(guān)

    SPSS操作:分析-一般線性模型-單變量

    • 全因子模型:既考慮所有自變量對于因變量的直接效應(yīng),又考慮所有分類變量的交互作用對因變量的影響。
    • 構(gòu)建項(xiàng)(定制模型):可根據(jù)研究者自身需求,定制需要考慮的對因變量的影響因素。比如只考慮自變量的直接效應(yīng),或部分自變量的交互作用。
    • 當(dāng)自變量特別多時(shí),尤其是分類自變量特別多時(shí),且樣本量不多時(shí),應(yīng)該使用定制模型。
  • 重復(fù)方差檢驗(yàn)
  • 一個(gè)因變量,在多個(gè)時(shí)刻重復(fù)測量多次,自變量可以有也可以沒有

  • F檢驗(yàn)常用術(shù)語
    • 因素(Factor)

    因素是可能對因變量有影響的變量,一般來說,因素會不止一個(gè)水平,而分析的目的就是考察或比較各個(gè)水平對一變量的影響是否相同。

    • 水平(Level)

    因素的不同取值等級稱作水平,例如八性別有男、女兩個(gè)水平。

    • 單元(Cell)

    單元亦稱實(shí)驗(yàn)水平(Experimental Unit),指各因素水平之間的每種組合。指各因素各水平的組合,例如在研究性別(二水平)、血型(四水平)對成年人身高的影響時(shí),該設(shè)計(jì)最多可以有2*4=8個(gè)單元。注意在一些特殊的實(shí)驗(yàn)設(shè)計(jì)中,可能有的單元在樣本中并不會出現(xiàn),如正交設(shè)計(jì)。

    • 元素(Element)
    • 指用于測量因變量值的觀察單位,比如研究職業(yè)與收入之間的關(guān)系,月收入是從每一位受訪者處得到,則每位受訪者就是實(shí)驗(yàn)的因素。
    • 一個(gè)單元格內(nèi)可以有多個(gè)元素,也可以只有一個(gè),甚至于沒有元素。
    • 注意:元素不一定等同于受訪者個(gè)體!
    • 重復(fù)測量數(shù)據(jù)
    • 以家庭為單位收集資料
    • 均衡(Balance)

    如果在一個(gè)實(shí)驗(yàn)設(shè)計(jì)中任一因素各水平在所有單元格中出現(xiàn)的次數(shù)相同,且每個(gè)單元格內(nèi)的元素?cái)?shù)均相同,則該試驗(yàn)是均衡的;否則,就被稱為不均衡。不均衡的實(shí)驗(yàn)設(shè)計(jì)在分析時(shí)較為復(fù)雜,需要對方差分析模型作特別設(shè)置才能得到正確的分析結(jié)果。

    • 協(xié)變量(Covariates)

    指對因變量可能有影響,需要在分析時(shí)對其作用加以控制的連續(xù)變量,實(shí)際上,可以簡單的把因素和協(xié)變量分別理解為分類自變量和連續(xù)自變量。當(dāng)模型中存在協(xié)變量時(shí),一般是通過找出它與因變量的回歸關(guān)系來控制其影響。

    • 交互作用(Interaction)
    • 如果一個(gè)因素的效應(yīng)大小在另一個(gè)因素不同水平下明顯相同,則稱為兩因素間存在交互作用。當(dāng)存在交互作用時(shí),單純研究某個(gè)因素的作用是沒有意義的,必須分另一個(gè)因素的不同水平研究該因素的作用大小。
    • 如果所有單元格內(nèi)都至多只有一個(gè)元素,則交互作用無法進(jìn)行分析,只能不予考慮。
    • 固定因素(Fixed Factor)
    • 指的是該因素在樣本中所有可能的水平都出現(xiàn)了。從樣本的分析結(jié)果中就可以得到所有水平的狀況,無需進(jìn)行外推。絕大多數(shù)情況下,研究者所真正關(guān)心的因素都是固定因素。
    • 性別:只有兩種
    • 療法:只有三種
    • 隨機(jī)因素(Random Factor)
    • 該因素所有的可能取值在樣本中沒有出現(xiàn),目前在樣本中的這些水平是從總體中隨機(jī)抽樣而來,如果我們重復(fù)該研究,則可能得到的因素水平會和現(xiàn)在完全不同!
    • 這時(shí),研究者顯然希望得到的是一個(gè)能夠“泛化”,即對所有可能出現(xiàn)的水平均適用的結(jié)果。這不可避免的存在誤差,需要估計(jì)誤差的大小,因此被稱為隨機(jī)因素。

    第二節(jié) 多指標(biāo)統(tǒng)計(jì)分析

    • 多變量分析方法的選擇
    分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子
    有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析
    定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析
    定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis
    定性數(shù)據(jù)對數(shù)線性回歸
    無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)
    定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)
    (其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型
    基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
    • 分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
    分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子
    有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析
    定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析
    定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis
    定性數(shù)據(jù)對數(shù)線性回歸
    無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)
    定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)
    (其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型
    基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析

    <table data-draft-node="block" data-draft-type="table" data-size="normal" data-row-style="normal">分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
    • 分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
    分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子
    有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析
    定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析
    定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis
    定性數(shù)據(jù)對數(shù)線性回歸
    無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)
    定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)
    (其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型
    基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
    分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析

    1、有因變量,則建立監(jiān)督模型

    • 有監(jiān)督模型具有兩大通用目的:

    1)分析哪些自變量對因變量存在顯著影響作用;

    2)通過選擇對因變量存在顯著影響的自變量,建立預(yù)測因變量取值的預(yù)測模型。

    1)

    a)因變量為連續(xù)變量(建立的模型稱為回歸預(yù)測模型),自變量為連續(xù)變量時(shí),可選擇回歸分析、方差分析;

    b)自變量為分類變量或分類+連續(xù)變量時(shí),可選擇帶虛擬變量的回歸分析、聯(lián)合分析、方差分析。

    2)因變量為分類變量(建立的模型稱為分類預(yù)測模型)

    a)當(dāng)自變量為分類變量(或連續(xù)+分類變量)時(shí),可選用判別分析、Logistic、probit回歸等;

    b)當(dāng)自變量全部為分類變量時(shí),可選用對數(shù)線性回歸。

    2、無因變量,則建立監(jiān)督模型

    • 目的:

    (1)對人進(jìn)行分類;(2)對變量/指標(biāo)進(jìn)行分類;(3)分析變量與變量之間的測量關(guān)系。

    1)自變量為連續(xù)變量時(shí),選擇因子分析(對變量/指標(biāo)進(jìn)行分類)、聚類分析(對人分類、對變量/指標(biāo)進(jìn)行分類)

    2)自變量為分類變量時(shí),選擇對應(yīng)分析(對人進(jìn)行分類)、多維尺度分析(對人進(jìn)行分析)

    3、其他分析

    1)當(dāng)模型中需要加入潛在變量(通過多個(gè)客觀指標(biāo)測量的抽象概念,例如幸福感)、或需要考慮多個(gè)變量之間的因果關(guān)系時(shí),可選擇結(jié)構(gòu)方程模型、路徑模型等。

    2)綜合評價(jià):通過多個(gè)指標(biāo)對多個(gè)評價(jià)對象進(jìn)行排名,可選用層次分析法、因子分析等。

    第一節(jié) 相關(guān)分析

    • 不同變量類型的相關(guān)系數(shù)

    1)兩個(gè)變量都為連續(xù)變量,則可用pearson相關(guān)系數(shù);

    2)兩個(gè)變量都為定序變量,則可用GMMA等相關(guān)系數(shù);

    3)兩個(gè)變量都為定類變量,則可用LAMMDA相關(guān)系數(shù);

    4)一個(gè)變量為定類變量,一個(gè)變量為連續(xù)變量,則可通過ETA系數(shù)來測量相關(guān)性。

    • 相關(guān)系數(shù)是衡量兩個(gè)變量之間變化趨勢的相似性。
    • 相關(guān)系數(shù)的目的:計(jì)算兩個(gè)變量在樣本系數(shù)中的相關(guān)性強(qiáng)弱。
    • 相關(guān)分析的假設(shè)檢驗(yàn)

    原假設(shè):兩個(gè)變量來自的總體中不存在顯著相關(guān)性;

    研究假設(shè):兩個(gè)變量來自的總體中存在顯著相關(guān)性。

    • 顯著性檢驗(yàn)的目的:用來判斷兩個(gè)變量在總體中是否存在相關(guān)性。

    1、雙變量相關(guān)分析

    1)皮爾遜(pearson)相關(guān)系數(shù):參數(shù)檢驗(yàn),針對兩個(gè)都是連續(xù)變量的數(shù)據(jù)進(jìn)行相關(guān)性判斷。

    2)斯皮爾曼(spearman)相關(guān)系數(shù),非參數(shù)檢驗(yàn),針對兩個(gè)都是定序變量。

    3)肯德爾tau-b(Kendall's tau-b)相關(guān)系數(shù),非參數(shù)檢驗(yàn),針對兩個(gè)都是定序變量

    SPSS操作:分析-相關(guān)-雙變量

    2、偏相關(guān)系數(shù)

    在很多現(xiàn)實(shí)情況,單純兩個(gè)變量之間的相關(guān)性,還會受到其他變量的干擾,因此考察兩個(gè)變量的相關(guān)性時(shí)往往需要剔除干擾變量的影響,再來計(jì)算相關(guān)性。比如,商品需求量和價(jià)格、消費(fèi)者收入之間的關(guān)系,需求量與價(jià)格之間的相關(guān)關(guān)系還包含了消費(fèi)者收入對商品需求量的影響。同時(shí),收入對價(jià)格也會產(chǎn)生影響,并通過價(jià)格變動傳遞到對商品需求量的影響中。

    注意:計(jì)算相關(guān)性的變量為連續(xù)變量,加入控制的變量同樣也是連續(xù)變量。

    3.典型相關(guān)分析(又稱為規(guī)則相關(guān)分析)

    用來分析兩組變量整體的相關(guān)性,而不是變量個(gè)體之間的相關(guān)性,兩組變量的個(gè)數(shù)可以不同。測量的仍然是變量之間的線性相關(guān)性。要求每組內(nèi)的變量也呈現(xiàn)線性關(guān)系,另外組內(nèi)變量間不能存在高度的復(fù)共線性。原始數(shù)據(jù)標(biāo)準(zhǔn)化之后再計(jì)算,則得到標(biāo)準(zhǔn)化的相關(guān)系數(shù)。

    SPSS操作:分析-相關(guān)-典型相關(guān)性

    第二節(jié) 回歸分析

    1、當(dāng)需要用一個(gè)數(shù)學(xué)表達(dá)式(模型)表示多個(gè)因素(原因)與另外一個(gè)因素(原因)之間的關(guān)系時(shí),可選用回歸分析法。

    • 回歸分析的目的:

    1)分析哪些自變量對因變量存在顯著影響作用,R方值可以要求不大于0.8;

    2)通過選擇對因變量存在顯著影響的自變量,建立預(yù)測因變量取值的預(yù)測模型;模型R方值必須要求大于等于0.8。

    但是,在人文社科領(lǐng)域,很多回歸模型的R方值達(dá)不到0.8,也可以用來做預(yù)測。

    2、回歸分析的建立步驟

    1)選擇變量

    因變量:根據(jù)研究需求或問題推到出來

    自變量:1)前人的研究成果

    2)個(gè)人經(jīng)驗(yàn)

    2)確定自變量與因變量之間的關(guān)系

    首先,挨個(gè)將自變量與因變量畫散點(diǎn)圖,判斷每個(gè)自變量與因變量之間是線性關(guān)系還是非線性關(guān)系。

    其次,通過卡方檢驗(yàn),T檢驗(yàn)、F檢驗(yàn)或相關(guān)分析法,挨個(gè)分析每個(gè)備選的自變量與因變量之間是否存在顯著的相關(guān)性。將與因變量沒有顯著相關(guān)性的自變量剔除掉,不加入到后期的模型中。

    3)選擇對應(yīng)的線性方程或非線性方程,進(jìn)行各項(xiàng)參數(shù)的計(jì)算

    4)對模型進(jìn)行全方位檢驗(yàn)

    • 多重共線性檢驗(yàn)

    檢驗(yàn)多個(gè)自變量之間是否存在相關(guān)性較高的變量,如有,則保留與因變量相關(guān)性最高的一個(gè)自變量。

    • 模型擬合度檢驗(yàn)
      • 方差檢驗(yàn):檢驗(yàn)把自變量與因變量是否存在顯著影響關(guān)系;
      • 判定系數(shù)(R方):0-1之間,越接近1表示自變量對因變量的解釋能力越高,模型越好;
      • 殘差檢驗(yàn):常用的方法包括殘差正態(tài)性檢驗(yàn)、DW檢驗(yàn)、異方差檢驗(yàn);
      • 自變量參數(shù)檢驗(yàn):(參數(shù)估計(jì)方法:普通最小二乘法(OLS: Ordinary Least Square)和極大似然估計(jì)(MLE: Maximum Likelihood Estimate) )

    3、回歸分析的軟件操作

    解決問題:分析影響人們家庭收入的因素有哪些,建立預(yù)測回收的預(yù)測模型。

    因變量:家庭收入

    自變量:性別,年齡,學(xué)歷,工作年限

    SPSS操作:分析-回歸-線性-

    統(tǒng)計(jì):共線性診斷&德賓-沃森(DW)-圖-標(biāo)準(zhǔn)化殘差圖:直方圖&正態(tài)概率圖

    4、虛擬變量

    使用虛擬變量的原因:分類變量無法參與到回歸模型中加減乘除運(yùn)算

    SPSS操作:將原先的分類編碼統(tǒng)一轉(zhuǎn)換為0,1數(shù)值

    轉(zhuǎn)換-重新編碼為不同變量-舊值和新值-定義舊值與新值的轉(zhuǎn)換關(guān)系

    Ed=1 2 3 4 5

    123(對照人群)45
    Ed110000
    Ed201000
    Ed300010
    Ed400001

    5、回歸分析的結(jié)果解讀

    1)擬合優(yōu)度檢驗(yàn)

    R方值

    F值,F值對應(yīng)的概率P值<0.05,研究假設(shè)成立,即至少有一個(gè)自變量對因變量存在顯著影響。

    2)參數(shù)顯著性檢驗(yàn)

    根據(jù)每個(gè)自變量的t值對應(yīng)的概率p值是否<0.05,如<0.05,則研究假設(shè)成立,即該自變量對因變量存在顯著影響。

    根據(jù)下表得出:

    工作年限和學(xué)歷對收入存在顯著影響,而年齡和性別沒有。通過標(biāo)準(zhǔn)化系數(shù)來判斷兩者的影響程度大小,可知工作年限的影響明顯大于學(xué)歷。

    工作年限對收入影響程度:在其他變量不變的情況下,工作年限每增加一個(gè)單位(1年),則因變量家庭收入平均增加6.279個(gè)單位。

    學(xué)歷對收入的影響程度:ed1=-51.042表示ed1代表的學(xué)歷(高中以下)比對照的學(xué)歷人群(大專)在因變量家庭收入上平均低51.042個(gè)單位。

    3)共線性檢驗(yàn)

    通常根據(jù)VIF>10,自變量之間存在共線性。

    4)殘差檢驗(yàn)

    DW=2,表示殘差不存在自相關(guān)性。

    5)回歸方程

    先通過逐步回歸法,將對因變量沒有顯著影響的自變量從模型中刪除,得到干凈的模型。

    方程:y=34.601+6.021*工作年限-62.647*ed1-36.379*ed2。

    6、非線性回歸

    求解方式:

    • 第一種是線性轉(zhuǎn)換,原因是非線性方程擬合方法和參數(shù)初始值設(shè)置均會導(dǎo)致求出的結(jié)果并非全局最優(yōu)解。
    • 第二種是直接建立非線性方程,求解非線性模型。

    SPSS操作:先通過散點(diǎn)圖判斷是否存在非線性關(guān)系

    自變量:Ininc

    因變量:Income

    Income=e^ Ininc

    第三節(jié) 因子分析

    目的:對多個(gè)具有相似度的目標(biāo)/變量進(jìn)行降維,前提是這些變量/指標(biāo)之間必須存在一定的相關(guān)性/相似性

    1、應(yīng)用場景:

    1)降維后做綜合評價(jià)

    2)效度檢驗(yàn):對抽樣概念的測量工具進(jìn)行有效性檢驗(yàn),判斷哪些指標(biāo)需要保留或刪除,并對保留的指標(biāo)進(jìn)行圍堵劃分。

    3)降維后做其他分析:由于變量之間存在較高相關(guān)性,不適合做回歸分析、聚類等其他分析,需要用因子分析消除變量較高的共線性。

    2、因子旋轉(zhuǎn)的目的

    1)使得因子可以更好的代表原來的變量

    2)降低或消除提取因子之間的相關(guān)性

    SPSS操作:分析-降維-因子-描述:KMO-提取:碎石圖-旋轉(zhuǎn):最大方差法-得分:保存為變量&顯示因子得分系數(shù)矩陣-選項(xiàng):按大小排序&排除小系數(shù)

    3、因子分析的結(jié)果解讀

    1)KMO>0.7,適合做因子分析

    2)累計(jì)方差貢獻(xiàn)率需要達(dá)到多少才合適?

    如果通過因子分析降維后做綜合評價(jià),那么累計(jì)方差貢獻(xiàn)率需要>80%;

    效度檢驗(yàn)或其他分析,60%以上。

    3)因子劃分:根據(jù)每個(gè)變量在每個(gè)因子中的取值是否>0.5。

    4)效度檢驗(yàn):

    第一判斷標(biāo)準(zhǔn):每個(gè)變量有且只有一個(gè)因在載荷值>0.5,如果所有因子載荷值均<0.5,則說明該變量不具有收斂效度,需刪除;

    第二判斷標(biāo)準(zhǔn):變量在兩個(gè)或以上因子中的載荷值同時(shí)>0.5,則說明該變量不具有區(qū)分效度,需刪除;

    第三個(gè)判斷標(biāo)準(zhǔn):某變量單獨(dú)成為一個(gè)因子,則說明該變量也不存在收斂效度,需刪除。

    5)因子得分計(jì)算:F1=x1*a1+x2*a2+…

    第四節(jié) Logistic回歸

    應(yīng)用場景:做分類預(yù)測模型,且為非參數(shù)檢驗(yàn)方法。可以用于二分類、無序多分類、有序多分類。

    1、二元Logistic回歸

    1)結(jié)果解讀:1)根據(jù)檢驗(yàn)中的p<0.05,得到自變量對因變量存在顯著影響。

    2)根據(jù)瓦爾德值的大小,判斷自變量對因變量的影響程度排名。

    3)優(yōu)勢比(OR)值>1,表示該自變量會增加因變量取1的概率的發(fā)生;反之會降低因變量取1的概率。

    4)連續(xù)變量對因變量的影響程度:在其他變量不變的情況下,當(dāng)年齡增加一個(gè)單位,優(yōu)勢比增加1.385倍(年齡越大,退休概率越高)。

    5)分類自變量對因變量的影響程度:在其他變量不變的情況下,大專學(xué)歷的優(yōu)勢比是研究生學(xué)歷優(yōu)勢比的0.120倍(大專學(xué)歷的退休概率高于研究生學(xué)歷的退休概率)。

    2)Logistic公式:ln(p/(1-p))=20.305-0.782*ed1-0.561*ed2-2.121*ed3+…

    SPSS操作:分析-回歸-二元Logistic-分類:分類協(xié)變量-保存:概率&組成員-選項(xiàng):Exp的置信區(qū)間

    2、多元Logistic回歸

    SPSS操作:分析-回歸-多元Logistic-保存:預(yù)測類別&預(yù)測類別概率

    3、有序Logistic回歸

    首先需要進(jìn)行平行性檢驗(yàn),檢驗(yàn)當(dāng)因變量劃分不停取值時(shí)建立的多個(gè)二元Logistic回歸

    ,自變量對因變量的影響程度是相同的;如果該檢驗(yàn)不成立,則不能選擇有序多分類模型,改用無序多分類模型。

    當(dāng)P>0.05時(shí),說明原假設(shè)成立,則平行性檢驗(yàn)成立,可以建立有序多分類模型。

    解讀:

    1)模型公式

    • ln(p1/(1-p1))=-2.494-0.032*age+0.003*income (p1表示學(xué)歷取1的概率)
    • ln(p2/(1-p2))=-1.110-0.032*age+0.003*income (p2表示學(xué)歷取1的概率)
    • ln(p3/(1-p3))=-0.192-0.032*age+0.003*income (p3表示學(xué)歷取1的概率)
    • ln(p4/(1-p4))=1.649-0.032*age+0.003*income (p4表示學(xué)歷取1的概率)

    SPSS操作:分析-回歸-有序-輸出:平行線檢驗(yàn)&估算響應(yīng)概率&預(yù)測類別&預(yù)測類別概率

    第四節(jié) 時(shí)間序列回歸

    1、格蘭杰因果檢驗(yàn)

    因果關(guān)系成立的三個(gè)條件:

    1)AB兩個(gè)事件必須存在相關(guān)性

    2)原因A必須發(fā)生在結(jié)果B之前

    3)排除其他干擾因素

    2、平穩(wěn)序列

    ARIMA模型建立的前提是時(shí)間序列數(shù)據(jù)必須為平穩(wěn)序列,可通過單位根檢驗(yàn)(ADF)來判斷一個(gè)序列是否平穩(wěn);如果不平穩(wěn),可通過差分進(jìn)行轉(zhuǎn)換。

    3、周期性計(jì)算

    1)通過自相關(guān)系數(shù)(ACF)圖的拐點(diǎn),乘以4得到周期。

    SPSS操作:

    • 定義時(shí)間:數(shù)據(jù)-定義日期和時(shí)間
    • 分析-時(shí)間序列預(yù)測

    2)譜分析

    通過頻率取值最高的點(diǎn)對應(yīng)的頻率乘以數(shù)據(jù)量,得到周期。

    SPSS操作:分析-時(shí)間序列預(yù)測-譜分析

    4、解讀:

    1)時(shí)間序列假設(shè)檢驗(yàn)

    通過Ljung-Box Q檢驗(yàn),原假設(shè)是:模型可以很好的擬合原始數(shù)據(jù),p>0.05,表示模型可以接受,p值越大模型越好。

    2)模型

    Yt=8.579+0.999*Yt-1+0.633*Yt-12

    3)時(shí)間序列因果模型

    Y1t=a1*Y1t-1+a2*Y1t-12+a3*Y4t-2+a4*Y2t-12+a0

    總結(jié)

    以上是生活随笔為你收集整理的datagrid出现相同两组数据_数据分析之统计学的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。