當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

datagrid出现相同两组数据_数据分析之统计学

發(fā)布時(shí)間：2024/9/19 编程问答 50 豆豆

生活随笔收集整理的這篇文章主要介紹了 datagrid出现相同两组数据_数据分析之统计学小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

統(tǒng)計(jì)學(xué)知識

思維導(dǎo)圖

第一節(jié) 統(tǒng)計(jì)學(xué)基本原理

數(shù)據(jù)分析相關(guān)概念

一、描述統(tǒng)計(jì)

測量尺度

1.定類（nominal）

功能：分類的作用，比如性別

2.定序(ordinal)

功能：分類、排序的作用，比如最想去的國家

3.定距(scale)

功能：分類、排序、加減，比如溫度

4.定比(scale)

功能：分類、排序、加減、乘除，比如年齡

定類與定序合并成分類變量，定距與定比合并成連續(xù)變量。

分類變量的描述統(tǒng)計(jì)方法只能用頻次統(tǒng)計(jì)，對于連續(xù)變量既可以用頻次統(tǒng)計(jì)也可以用均值和標(biāo)準(zhǔn)差。

均值

1.算數(shù)平均

2.幾何平均

3.調(diào)和平均

可能用在數(shù)據(jù)中較多數(shù)值集中在最小值附近，原因可能是因?yàn)檎{(diào)和平均相對于算數(shù)、幾何平均最小。

4.調(diào)整平均

去掉上限值或者下限值，比例一般為5%

中位數(shù)和眾數(shù)

1.中位數(shù)：

當(dāng)一組序列數(shù)據(jù)之間差異較大時(shí)，導(dǎo)致平均值代表性較弱，可通過中位數(shù)來表示數(shù)據(jù)的集中趨勢。

平均值、中位數(shù)通常應(yīng)用在連續(xù)變量中，即數(shù)值型變量；

眾數(shù)既可以應(yīng)用在連續(xù)變量也可以應(yīng)用在分類變量。

極差和方差、標(biāo)準(zhǔn)差

衡量離散趨勢，數(shù)據(jù)離散趨勢代表了數(shù)據(jù)中包含的信息量。

1.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差計(jì)算公式中，有的除以n，有的除以n-1；

當(dāng)計(jì)算總體數(shù)據(jù)標(biāo)準(zhǔn)差時(shí)，除以n，

通過樣本數(shù)據(jù)計(jì)算總體標(biāo)準(zhǔn)差時(shí)，除以n-1；

原因是人為增大標(biāo)準(zhǔn)差以提高代表性。

2.離散趨勢

如果希望比較兩組數(shù)據(jù)的離散趨勢，不能直接比較兩組數(shù)據(jù)的標(biāo)準(zhǔn)差，因?yàn)閮山M數(shù)據(jù)的樣本量和均值不同。通常選用離散系數(shù)來進(jìn)行比較，離散系數(shù)=標(biāo)準(zhǔn)差/平均值

二、總體推斷/假設(shè)檢驗(yàn)

1.Z值轉(zhuǎn)換公式

Z=(xi-x)/s

用來將t分布轉(zhuǎn)換為（0，1）z分布，又稱為標(biāo)準(zhǔn)化，或者叫Z值標(biāo)準(zhǔn)化；用于判斷哪些數(shù)值為異常值，|Z值|>3為異常值，|Z值|>5為極端值。

2.置信度

T=1.65 對應(yīng)90%的置信度

T=1.98 對應(yīng)95%的置信度

T=2.58 對應(yīng)99%的置信度

3.假設(shè)檢驗(yàn)

步驟：

定義H0和H1，H0通常定義兩個(gè)變量之間么有顯著差異

選擇合適的檢驗(yàn)方法，計(jì)算統(tǒng)計(jì)量（t值、F值、Z值、卡方值）

根據(jù)統(tǒng)計(jì)量計(jì)算概率P值

P值與顯著性水平5%對比；

P<5%，則拒絕原假設(shè)H0，接受研究假設(shè)H1；

P>5%，則接受原假設(shè)H0，拒絕研究假設(shè)H1。

三、抽樣方法

1、分層抽樣

如何讓選擇分層變量

選擇那些與研究主題高度相關(guān)的變量；比如研究收入問題時(shí)，考慮學(xué)歷、年齡、性別等影響收入的基本屬性。

成本：分層因素考慮越多，選取的樣本量則會越多；學(xué)歷（分為高中低3類）、收入（分為高中低3類）、性別（男女2類），總共18類，每類樣本量至少保證30人以上，18*30=540人；與研究主題不太相關(guān)的主題可以不考慮，或者將因素的分類減少。

四、卡方檢驗(yàn)

假設(shè)檢驗(yàn)的結(jié)論：

p>0.05，則原假設(shè)成立，研究假設(shè)不成立；

P<0.05，則原假設(shè)不成立，研究假設(shè)成立。

1.卡方檢驗(yàn)的重要性

適用于不知道總體參數(shù)的檢驗(yàn),是最常用的一種非參數(shù)檢驗(yàn)。

當(dāng)不適用于參數(shù)檢驗(yàn)法的時(shí)候，第一個(gè)想到的就是卡方檢驗(yàn)。

2.卡方檢驗(yàn)的應(yīng)用場景

比例分布檢驗(yàn)

檢驗(yàn)一個(gè)變量中取值的比例分布是否相等，或者是否符合設(shè)定的比例分布

原假設(shè)：變量的取值分布與均勻分布（研究者設(shè)定的分布）沒有顯著差異

研究假設(shè)：變量的取值分布與均勻分布（研究者設(shè)定的分布）有顯著差異

SPSS操作：分析-非參數(shù)檢驗(yàn)-舊對話框-卡方

二項(xiàng)式檢驗(yàn)

檢驗(yàn)一個(gè)變量取二分類兩個(gè)值的概率是否符合設(shè)定的概率

原假設(shè)：變量的第一個(gè)取值比例與設(shè)定比例沒有顯著差異。

研究假設(shè)：變量的第一個(gè)取值與設(shè)定比例有顯著差異。

SPSS操作：分析-非參數(shù)檢驗(yàn)-舊對話框-二項(xiàng)

分割點(diǎn)：是將一個(gè)連續(xù)變量，選擇一個(gè)值作為分割點(diǎn)

K-S檢驗(yàn)

檢驗(yàn)樣本來自的總體中，一個(gè)變量的分布是否服從正態(tài)分布、均勻分布、泊松分布、指數(shù)分布

原假設(shè)：變量來自總體的分布與正態(tài)分布（均勻分布等）沒有顯著差異，即變量在總體中呈現(xiàn)正態(tài)分布（或均勻分布等）。

研究假設(shè)：變量來自總體的分布與正態(tài)分布（均勻分布等）有顯著差異，即變量在總體中不呈現(xiàn)正態(tài)分布（或均勻分布等）。

SPSS操作：分析-非參數(shù)檢驗(yàn)-舊對話框-單樣本K-S

游程檢驗(yàn)

檢驗(yàn)一個(gè)變量的兩個(gè)取值的出現(xiàn)順序是否隨機(jī)。兩個(gè)值出現(xiàn)比例各占50%。

檢驗(yàn)場景：通常是檢驗(yàn)隨著時(shí)間變化而產(chǎn)生的兩個(gè)數(shù)值，出現(xiàn)順序是否隨機(jī)。

原假設(shè)：變量的兩個(gè)值的出現(xiàn)順序和隨機(jī)出現(xiàn)沒有顯著差異。

研究假設(shè)：變量的兩個(gè)值的出現(xiàn)順序不是隨機(jī)的。

SPSS操作：分析-非參數(shù)檢驗(yàn)-舊對話框-游程檢驗(yàn)

獨(dú)立樣本非參數(shù)檢驗(yàn)

獨(dú)立樣本：兩組不重疊的樣本，檢驗(yàn)不同人群在特定變量在取值上是否有差異；

比如男性和女性在收入分布上是否有差異。

原假設(shè)：兩組來自總體的變量數(shù)據(jù)在分布上沒有顯著差異，即兩組數(shù)據(jù)在該變量的取值上沒有顯著差異。

研究假設(shè)：兩組來自總體的變量數(shù)據(jù)在分布上有顯著差異，即兩組數(shù)據(jù)在該變量的取值上有顯著差異。

注意：分組變量是分類變量，比較變量是連續(xù)變量

SPSS操作：分析-非參數(shù)檢驗(yàn)-舊對話框-2個(gè)獨(dú)立樣本

配對樣本非參數(shù)檢驗(yàn)

配對樣本：同一組人群不同時(shí)間采集的兩組或多組數(shù)據(jù)，或者同一組人群不同身體部位所采集的兩組或多組數(shù)據(jù)。

檢驗(yàn)同一組人群在不同時(shí)間、不用部位采集的數(shù)據(jù)是否有差異。

原假設(shè)：來自總體的同一組人群的兩組數(shù)據(jù)在分布上沒有顯著差異，即兩組數(shù)據(jù)在該變量的取值上沒有顯著差異。

研究假設(shè)：來自總體的同一組人群的兩組數(shù)據(jù)在分布上有顯著差異，即兩組數(shù)據(jù)在該變量的取值上有顯著差異。

注意：t1、t2，比較的變量必須是連續(xù)變量

SPSS操作：分析-非參數(shù)檢驗(yàn)-舊對話框-2個(gè)相關(guān)樣本

交叉分析（列聯(lián)表分析）

檢驗(yàn)兩個(gè)分類變量（定類和定序）是否有相關(guān)性。

如果場景中需要對連續(xù)變量進(jìn)行卡方檢驗(yàn)，首先需要將連續(xù)變量轉(zhuǎn)換為分類變量；如年齡分成70后、80后、90后、00后。

SPSS操作：分析-描述統(tǒng)計(jì)-交叉表

連續(xù)變量轉(zhuǎn)換成分類變量的操作：轉(zhuǎn)換-重新編碼為不同變量，收入分為0-50，51-400，401及以上
如果兩個(gè)變量都是定類變量，相關(guān)系數(shù)可通過卡方檢驗(yàn)中“名義”里的4個(gè)相關(guān)系數(shù)；如果兩個(gè)變量都是定序變量，則選擇“有序”里的4個(gè)相關(guān)系數(shù)。
問：如果兩個(gè)變量中，一個(gè)為定類變量，一個(gè)為定序變量，相關(guān)系數(shù)應(yīng)該選哪個(gè)？

答；應(yīng)該選“名義”中的4個(gè)相關(guān)系數(shù)。原因是定序變量可以降級為定類變量，而定類變量不可以升級為定序變量。

卡方檢驗(yàn)結(jié)果解讀：

第一步：看卡方統(tǒng)計(jì)結(jié)果，根據(jù)P值判斷兩個(gè)變量是否存在相關(guān)性；如p<0.05，則說明兩者存在顯著相關(guān)性。

第二步：看相關(guān)系數(shù)，判斷兩者之間相關(guān)性到底有多大。

0-0.2，較弱相關(guān)；
0.2-0.4，弱相關(guān)；
0.4-0.6，相關(guān)性一般；
0.6-0.8，弱強(qiáng)相關(guān)；
0.8-1，極強(qiáng)相關(guān)。

第三步：看頻次分布，具體分析兩者存在什么樣的相關(guān)。

五、t檢驗(yàn)、方差檢驗(yàn)

1.t檢驗(yàn)

單樣本t檢驗(yàn)

用來檢驗(yàn)樣本中某個(gè)連續(xù)變量的均值與給定的總體均值是否存在差異。

用到的變量：一個(gè)連續(xù)變量。

原假設(shè)：樣本所來自總體的均值與給定的均值之間沒有顯著差異。

研究假設(shè)：樣本所來自總體的均值與給定的均值之間有顯著差異。

SPSS操作：分析-比較平均值-單樣本T檢驗(yàn)

獨(dú)立樣本t檢驗(yàn)

用來檢驗(yàn)兩組獨(dú)立樣本在某個(gè)連續(xù)變量的均值是否有顯著差異。

用到的變量：一個(gè)連續(xù)變量和一個(gè)分類變量（也可以將連續(xù)變量進(jìn)行分組得到一個(gè)分類變量）。

原假設(shè)：樣本所來自總體的均值與給定的均值之間沒有顯著差異。

研究假設(shè)：樣本所來自總體的均值與給定的均值之間有顯著差異。

SPSS操作：分析-比較平均值-獨(dú)立樣本T檢驗(yàn)

方差齊性檢驗(yàn)

原假設(shè)：兩組總體中的方差是相等的（沒有差異的）。

研究假設(shè)：兩組總體中的方差是不相等的（有差異的）。

當(dāng)p>0.05時(shí)，原假設(shè)成立；即兩組總體中的方差是相等的，需要看第一行的t值檢驗(yàn)結(jié)果。反之則看第二行的t值檢驗(yàn)結(jié)果。

配對樣本t檢驗(yàn)

用來檢驗(yàn)同一樣本不同時(shí)間/部位/處理?xiàng)l件測量得到的兩組數(shù)據(jù)均值是否存在差異。

原假設(shè)：樣本所來自總體的均值與給定的均值之間沒有顯著差異。

研究假設(shè)：樣本所來自總體的均值與給定的均值之間有顯著差異。

變量：兩個(gè)人連續(xù)變量（其實(shí)是針對同一組人群不同時(shí)間/處理部位/條件測量的兩組數(shù)據(jù)）

SPSS操作：分析-比較平均值-成對樣本t檢驗(yàn)

2.方差檢驗(yàn)

變量：變量既可以是分類也可以是連續(xù)變量，因變量必須是連續(xù)變量

單因素方差檢驗(yàn)

檢驗(yàn)3組人群及以上在某個(gè)連續(xù)變量均值上是否存在差異，或某個(gè)分類變量對連續(xù)變量是否存在顯著相關(guān)。

變量：自變量為一個(gè)，是分類變量；因變量是一個(gè)，且為連續(xù)變量。

原假設(shè)：不同人群之間在該連續(xù)變量的均值沒有顯著差異（自變量與因變量之間不存在顯著相關(guān)）

研究假設(shè)：不同人群之間在該連續(xù)變量的均值有顯著差異（自變量與因變量之間存在顯著相關(guān)）

SPSS操作：分析-比較平均值-單因素ANOVA檢驗(yàn)

兩兩比較中根據(jù)方差齊性檢驗(yàn)結(jié)果，來選擇方差相等的比較結(jié)果或方差不等的檢驗(yàn)結(jié)果。
方差齊性檢驗(yàn)：“選項(xiàng)”中-勾選“方差齊性檢驗(yàn)”。當(dāng)方差不齊時(shí)，則通過非參數(shù)檢驗(yàn)中的K個(gè)獨(dú)立樣本檢驗(yàn)法進(jìn)行檢驗(yàn)。

多因素方差檢驗(yàn)

檢驗(yàn)多個(gè)變量在某個(gè)連續(xù)變量均值上是否存在差異，或多個(gè)變量對連續(xù)變量是否存在顯著相關(guān)。

變量：自變量為多個(gè)，既可以是分類變量也可以是連續(xù)變量；因變量是一個(gè)，且為連續(xù)變量。

原假設(shè)：多個(gè)自變量與因變量之間不存在顯著相關(guān)

研究假設(shè)：多個(gè)自變量與因變量之間存在顯著相關(guān)

SPSS操作：分析-一般線性模型-單變量

全因子模型：既考慮所有自變量對于因變量的直接效應(yīng)，又考慮所有分類變量的交互作用對因變量的影響。
構(gòu)建項(xiàng)（定制模型）：可根據(jù)研究者自身需求，定制需要考慮的對因變量的影響因素。比如只考慮自變量的直接效應(yīng)，或部分自變量的交互作用。
當(dāng)自變量特別多時(shí)，尤其是分類自變量特別多時(shí)，且樣本量不多時(shí)，應(yīng)該使用定制模型。

重復(fù)方差檢驗(yàn)

一個(gè)因變量，在多個(gè)時(shí)刻重復(fù)測量多次，自變量可以有也可以沒有

F檢驗(yàn)常用術(shù)語

因素（Factor）

因素是可能對因變量有影響的變量，一般來說，因素會不止一個(gè)水平，而分析的目的就是考察或比較各個(gè)水平對一變量的影響是否相同。

水平（Level）

因素的不同取值等級稱作水平，例如八性別有男、女兩個(gè)水平。

單元（Cell）

單元亦稱實(shí)驗(yàn)水平（Experimental Unit），指各因素水平之間的每種組合。指各因素各水平的組合，例如在研究性別（二水平）、血型（四水平）對成年人身高的影響時(shí)，該設(shè)計(jì)最多可以有2*4=8個(gè)單元。注意在一些特殊的實(shí)驗(yàn)設(shè)計(jì)中，可能有的單元在樣本中并不會出現(xiàn)，如正交設(shè)計(jì)。

元素（Element）
指用于測量因變量值的觀察單位，比如研究職業(yè)與收入之間的關(guān)系，月收入是從每一位受訪者處得到，則每位受訪者就是實(shí)驗(yàn)的因素。
一個(gè)單元格內(nèi)可以有多個(gè)元素，也可以只有一個(gè)，甚至于沒有元素。
注意：元素不一定等同于受訪者個(gè)體！
重復(fù)測量數(shù)據(jù)
以家庭為單位收集資料
均衡（Balance）

如果在一個(gè)實(shí)驗(yàn)設(shè)計(jì)中任一因素各水平在所有單元格中出現(xiàn)的次數(shù)相同，且每個(gè)單元格內(nèi)的元素?cái)?shù)均相同，則該試驗(yàn)是均衡的；否則，就被稱為不均衡。不均衡的實(shí)驗(yàn)設(shè)計(jì)在分析時(shí)較為復(fù)雜，需要對方差分析模型作特別設(shè)置才能得到正確的分析結(jié)果。

協(xié)變量（Covariates）

指對因變量可能有影響，需要在分析時(shí)對其作用加以控制的連續(xù)變量，實(shí)際上，可以簡單的把因素和協(xié)變量分別理解為分類自變量和連續(xù)自變量。當(dāng)模型中存在協(xié)變量時(shí)，一般是通過找出它與因變量的回歸關(guān)系來控制其影響。

交互作用（Interaction）
如果一個(gè)因素的效應(yīng)大小在另一個(gè)因素不同水平下明顯相同，則稱為兩因素間存在交互作用。當(dāng)存在交互作用時(shí)，單純研究某個(gè)因素的作用是沒有意義的，必須分另一個(gè)因素的不同水平研究該因素的作用大小。
如果所有單元格內(nèi)都至多只有一個(gè)元素，則交互作用無法進(jìn)行分析，只能不予考慮。
固定因素（Fixed Factor）
指的是該因素在樣本中所有可能的水平都出現(xiàn)了。從樣本的分析結(jié)果中就可以得到所有水平的狀況，無需進(jìn)行外推。絕大多數(shù)情況下，研究者所真正關(guān)心的因素都是固定因素。
性別：只有兩種
療法：只有三種
隨機(jī)因素（Random Factor）
該因素所有的可能取值在樣本中沒有出現(xiàn)，目前在樣本中的這些水平是從總體中隨機(jī)抽樣而來，如果我們重復(fù)該研究，則可能得到的因素水平會和現(xiàn)在完全不同！
這時(shí)，研究者顯然希望得到的是一個(gè)能夠“泛化”，即對所有可能出現(xiàn)的水平均適用的結(jié)果。這不可避免的存在誤差，需要估計(jì)誤差的大小，因此被稱為隨機(jī)因素。

第二節(jié) 多指標(biāo)統(tǒng)計(jì)分析

多變量分析方法的選擇

分析的目的	有無目標(biāo)變量（因變量、外部推測）	目標(biāo)變量的數(shù)據(jù)類型	解釋變量	具有代表的多變量分析的例子
有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）	有	定量數(shù)據(jù)（量的數(shù)據(jù)）	定量數(shù)據(jù)	多元回歸分析方差分析
定性數(shù)據(jù)	有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析
定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）	定量數(shù)據(jù)	判別分析(discriminate analysis）Logistic/probit analysis
定性數(shù)據(jù)	對數(shù)線性回歸
無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)	沒有	——	定量數(shù)據(jù)	因子分析(factor analysis)聚類分析(cluster analysis)
定性數(shù)據(jù)	對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)
（其他的分析）	加入潛在變量的因果關(guān)系分析模型	結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型
基于多個(gè)候補(bǔ)方案的一對一比較分析模型	層次分析法（analytic hierarchy process-AHP）因子分析

分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析

分析的目的	有無目標(biāo)變量（因變量、外部推測）	目標(biāo)變量的數(shù)據(jù)類型	解釋變量	具有代表的多變量分析的例子
有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）	有	定量數(shù)據(jù)（量的數(shù)據(jù)）	定量數(shù)據(jù)	多元回歸分析方差分析
定性數(shù)據(jù)	有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析
定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）	定量數(shù)據(jù)	判別分析(discriminate analysis）Logistic/probit analysis
定性數(shù)據(jù)	對數(shù)線性回歸
無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)	沒有	——	定量數(shù)據(jù)	因子分析(factor analysis)聚類分析(cluster analysis)
定性數(shù)據(jù)	對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)
（其他的分析）	加入潛在變量的因果關(guān)系分析模型	結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型
基于多個(gè)候補(bǔ)方案的一對一比較分析模型	層次分析法（analytic hierarchy process-AHP）因子分析

<table data-draft-node="block" data-draft-type="table" data-size="normal" data-row-style="normal">分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析

分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析

分析的目的	有無目標(biāo)變量（因變量、外部推測）	目標(biāo)變量的數(shù)據(jù)類型	解釋變量	具有代表的多變量分析的例子
有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）	有	定量數(shù)據(jù)（量的數(shù)據(jù)）	定量數(shù)據(jù)	多元回歸分析方差分析
定性數(shù)據(jù)	有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析
定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）	定量數(shù)據(jù)	判別分析(discriminate analysis）Logistic/probit analysis
定性數(shù)據(jù)	對數(shù)線性回歸
無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)	沒有	——	定量數(shù)據(jù)	因子分析(factor analysis)聚類分析(cluster analysis)
定性數(shù)據(jù)	對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)
（其他的分析）	加入潛在變量的因果關(guān)系分析模型	結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型
基于多個(gè)候補(bǔ)方案的一對一比較分析模型	層次分析法（analytic hierarchy process-AHP）因子分析

分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析分析的目的有無目標(biāo)變量（因變量、外部推測）目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目（想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果）有定量數(shù)據(jù)（量的數(shù)據(jù)）定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)（質(zhì)的數(shù)據(jù)）定量數(shù)據(jù)判別分析(discriminate analysis）Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)（其他的分析）加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型（協(xié)方差結(jié)構(gòu)分析（covariance tructure analysis; strucural equation model-SEM））路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法（analytic hierarchy process-AHP）因子分析

1、有因變量，則建立監(jiān)督模型

有監(jiān)督模型具有兩大通用目的：

1）分析哪些自變量對因變量存在顯著影響作用；

2）通過選擇對因變量存在顯著影響的自變量，建立預(yù)測因變量取值的預(yù)測模型。

1）

a)因變量為連續(xù)變量（建立的模型稱為回歸預(yù)測模型），自變量為連續(xù)變量時(shí)，可選擇回歸分析、方差分析；

b)自變量為分類變量或分類+連續(xù)變量時(shí)，可選擇帶虛擬變量的回歸分析、聯(lián)合分析、方差分析。

2)因變量為分類變量（建立的模型稱為分類預(yù)測模型）

a)當(dāng)自變量為分類變量（或連續(xù)+分類變量）時(shí)，可選用判別分析、Logistic、probit回歸等；

b)當(dāng)自變量全部為分類變量時(shí)，可選用對數(shù)線性回歸。

2、無因變量，則建立監(jiān)督模型

目的：

（1）對人進(jìn)行分類；（2）對變量/指標(biāo)進(jìn)行分類；（3）分析變量與變量之間的測量關(guān)系。

1）自變量為連續(xù)變量時(shí)，選擇因子分析（對變量/指標(biāo)進(jìn)行分類）、聚類分析（對人分類、對變量/指標(biāo)進(jìn)行分類）

2）自變量為分類變量時(shí)，選擇對應(yīng)分析（對人進(jìn)行分類）、多維尺度分析（對人進(jìn)行分析）

3、其他分析

1）當(dāng)模型中需要加入潛在變量（通過多個(gè)客觀指標(biāo)測量的抽象概念，例如幸福感）、或需要考慮多個(gè)變量之間的因果關(guān)系時(shí)，可選擇結(jié)構(gòu)方程模型、路徑模型等。

2）綜合評價(jià)：通過多個(gè)指標(biāo)對多個(gè)評價(jià)對象進(jìn)行排名，可選用層次分析法、因子分析等。

第一節(jié) 相關(guān)分析

不同變量類型的相關(guān)系數(shù)

1）兩個(gè)變量都為連續(xù)變量，則可用pearson相關(guān)系數(shù)；

2）兩個(gè)變量都為定序變量，則可用GMMA等相關(guān)系數(shù)；

3）兩個(gè)變量都為定類變量，則可用LAMMDA相關(guān)系數(shù)；

4）一個(gè)變量為定類變量，一個(gè)變量為連續(xù)變量，則可通過ETA系數(shù)來測量相關(guān)性。

相關(guān)系數(shù)是衡量兩個(gè)變量之間變化趨勢的相似性。
相關(guān)系數(shù)的目的：計(jì)算兩個(gè)變量在樣本系數(shù)中的相關(guān)性強(qiáng)弱。
相關(guān)分析的假設(shè)檢驗(yàn)

原假設(shè)：兩個(gè)變量來自的總體中不存在顯著相關(guān)性；

研究假設(shè)：兩個(gè)變量來自的總體中存在顯著相關(guān)性。

顯著性檢驗(yàn)的目的：用來判斷兩個(gè)變量在總體中是否存在相關(guān)性。

1、雙變量相關(guān)分析

1）皮爾遜(pearson)相關(guān)系數(shù)：參數(shù)檢驗(yàn)，針對兩個(gè)都是連續(xù)變量的數(shù)據(jù)進(jìn)行相關(guān)性判斷。

2）斯皮爾曼(spearman)相關(guān)系數(shù)，非參數(shù)檢驗(yàn)，針對兩個(gè)都是定序變量。

3）肯德爾tau-b(Kendall's tau-b)相關(guān)系數(shù)，非參數(shù)檢驗(yàn)，針對兩個(gè)都是定序變量

SPSS操作：分析-相關(guān)-雙變量

2、偏相關(guān)系數(shù)

在很多現(xiàn)實(shí)情況，單純兩個(gè)變量之間的相關(guān)性，還會受到其他變量的干擾，因此考察兩個(gè)變量的相關(guān)性時(shí)往往需要剔除干擾變量的影響，再來計(jì)算相關(guān)性。比如，商品需求量和價(jià)格、消費(fèi)者收入之間的關(guān)系，需求量與價(jià)格之間的相關(guān)關(guān)系還包含了消費(fèi)者收入對商品需求量的影響。同時(shí)，收入對價(jià)格也會產(chǎn)生影響，并通過價(jià)格變動傳遞到對商品需求量的影響中。

注意：計(jì)算相關(guān)性的變量為連續(xù)變量，加入控制的變量同樣也是連續(xù)變量。

3.典型相關(guān)分析（又稱為規(guī)則相關(guān)分析）

用來分析兩組變量整體的相關(guān)性，而不是變量個(gè)體之間的相關(guān)性，兩組變量的個(gè)數(shù)可以不同。測量的仍然是變量之間的線性相關(guān)性。要求每組內(nèi)的變量也呈現(xiàn)線性關(guān)系，另外組內(nèi)變量間不能存在高度的復(fù)共線性。原始數(shù)據(jù)標(biāo)準(zhǔn)化之后再計(jì)算，則得到標(biāo)準(zhǔn)化的相關(guān)系數(shù)。

SPSS操作：分析-相關(guān)-典型相關(guān)性

第二節(jié) 回歸分析

1、當(dāng)需要用一個(gè)數(shù)學(xué)表達(dá)式（模型）表示多個(gè)因素（原因）與另外一個(gè)因素（原因）之間的關(guān)系時(shí)，可選用回歸分析法。

回歸分析的目的：

1）分析哪些自變量對因變量存在顯著影響作用，R方值可以要求不大于0.8；

2）通過選擇對因變量存在顯著影響的自變量，建立預(yù)測因變量取值的預(yù)測模型；模型R方值必須要求大于等于0.8。

但是，在人文社科領(lǐng)域，很多回歸模型的R方值達(dá)不到0.8，也可以用來做預(yù)測。

2、回歸分析的建立步驟

1）選擇變量

因變量：根據(jù)研究需求或問題推到出來

自變量：1）前人的研究成果

2）個(gè)人經(jīng)驗(yàn)

2）確定自變量與因變量之間的關(guān)系

首先，挨個(gè)將自變量與因變量畫散點(diǎn)圖，判斷每個(gè)自變量與因變量之間是線性關(guān)系還是非線性關(guān)系。

其次，通過卡方檢驗(yàn)，T檢驗(yàn)、F檢驗(yàn)或相關(guān)分析法，挨個(gè)分析每個(gè)備選的自變量與因變量之間是否存在顯著的相關(guān)性。將與因變量沒有顯著相關(guān)性的自變量剔除掉，不加入到后期的模型中。

3）選擇對應(yīng)的線性方程或非線性方程，進(jìn)行各項(xiàng)參數(shù)的計(jì)算

4）對模型進(jìn)行全方位檢驗(yàn)

多重共線性檢驗(yàn)

檢驗(yàn)多個(gè)自變量之間是否存在相關(guān)性較高的變量，如有，則保留與因變量相關(guān)性最高的一個(gè)自變量。

模型擬合度檢驗(yàn)
- 方差檢驗(yàn)：檢驗(yàn)把自變量與因變量是否存在顯著影響關(guān)系；
- 判定系數(shù)（R方）：0-1之間，越接近1表示自變量對因變量的解釋能力越高，模型越好；
- 殘差檢驗(yàn)：常用的方法包括殘差正態(tài)性檢驗(yàn)、DW檢驗(yàn)、異方差檢驗(yàn)；
- 自變量參數(shù)檢驗(yàn)：（參數(shù)估計(jì)方法：普通最小二乘法(OLS: Ordinary Least Square)和極大似然估計(jì)(MLE: Maximum Likelihood Estimate) ）

3、回歸分析的軟件操作

解決問題：分析影響人們家庭收入的因素有哪些，建立預(yù)測回收的預(yù)測模型。

因變量：家庭收入

自變量：性別，年齡，學(xué)歷，工作年限

SPSS操作：分析-回歸-線性-

統(tǒng)計(jì)：共線性診斷&德賓-沃森(DW)-圖-標(biāo)準(zhǔn)化殘差圖：直方圖&正態(tài)概率圖

4、虛擬變量

使用虛擬變量的原因：分類變量無法參與到回歸模型中加減乘除運(yùn)算

SPSS操作：將原先的分類編碼統(tǒng)一轉(zhuǎn)換為0，1數(shù)值

轉(zhuǎn)換-重新編碼為不同變量-舊值和新值-定義舊值與新值的轉(zhuǎn)換關(guān)系

Ed=1 2 3 4 5

	1	2	3(對照人群)	4	5
Ed1	1	0	0	0	0
Ed2	0	1	0	0	0
Ed3	0	0	0	1	0
Ed4	0	0	0	0	1

5、回歸分析的結(jié)果解讀

1）擬合優(yōu)度檢驗(yàn)

R方值

F值，F值對應(yīng)的概率P值<0.05，研究假設(shè)成立，即至少有一個(gè)自變量對因變量存在顯著影響。

2）參數(shù)顯著性檢驗(yàn)

根據(jù)每個(gè)自變量的t值對應(yīng)的概率p值是否<0.05，如<0.05，則研究假設(shè)成立，即該自變量對因變量存在顯著影響。

根據(jù)下表得出：

工作年限和學(xué)歷對收入存在顯著影響，而年齡和性別沒有。通過標(biāo)準(zhǔn)化系數(shù)來判斷兩者的影響程度大小，可知工作年限的影響明顯大于學(xué)歷。

工作年限對收入影響程度：在其他變量不變的情況下，工作年限每增加一個(gè)單位（1年），則因變量家庭收入平均增加6.279個(gè)單位。

學(xué)歷對收入的影響程度：ed1=-51.042表示ed1代表的學(xué)歷（高中以下）比對照的學(xué)歷人群（大專）在因變量家庭收入上平均低51.042個(gè)單位。

3）共線性檢驗(yàn)

通常根據(jù)VIF>10，自變量之間存在共線性。

4）殘差檢驗(yàn)

DW=2，表示殘差不存在自相關(guān)性。

5）回歸方程

先通過逐步回歸法，將對因變量沒有顯著影響的自變量從模型中刪除，得到干凈的模型。

方程：y=34.601+6.021*工作年限-62.647*ed1-36.379*ed2。

6、非線性回歸

求解方式：

第一種是線性轉(zhuǎn)換，原因是非線性方程擬合方法和參數(shù)初始值設(shè)置均會導(dǎo)致求出的結(jié)果并非全局最優(yōu)解。
第二種是直接建立非線性方程，求解非線性模型。

SPSS操作：先通過散點(diǎn)圖判斷是否存在非線性關(guān)系

自變量：Ininc

因變量：Income

Income=e^ Ininc

第三節(jié) 因子分析

目的：對多個(gè)具有相似度的目標(biāo)/變量進(jìn)行降維，前提是這些變量/指標(biāo)之間必須存在一定的相關(guān)性/相似性

1、應(yīng)用場景：

1）降維后做綜合評價(jià)

2）效度檢驗(yàn)：對抽樣概念的測量工具進(jìn)行有效性檢驗(yàn)，判斷哪些指標(biāo)需要保留或刪除，并對保留的指標(biāo)進(jìn)行圍堵劃分。

3）降維后做其他分析：由于變量之間存在較高相關(guān)性，不適合做回歸分析、聚類等其他分析，需要用因子分析消除變量較高的共線性。

2、因子旋轉(zhuǎn)的目的

1）使得因子可以更好的代表原來的變量

2）降低或消除提取因子之間的相關(guān)性

SPSS操作：分析-降維-因子-描述：KMO-提取：碎石圖-旋轉(zhuǎn)：最大方差法-得分：保存為變量&顯示因子得分系數(shù)矩陣-選項(xiàng)：按大小排序&排除小系數(shù)

3、因子分析的結(jié)果解讀

1）KMO>0.7，適合做因子分析

2）累計(jì)方差貢獻(xiàn)率需要達(dá)到多少才合適？

如果通過因子分析降維后做綜合評價(jià)，那么累計(jì)方差貢獻(xiàn)率需要>80%；

效度檢驗(yàn)或其他分析，60%以上。

3）因子劃分：根據(jù)每個(gè)變量在每個(gè)因子中的取值是否>0.5。

4）效度檢驗(yàn)：

第一判斷標(biāo)準(zhǔn)：每個(gè)變量有且只有一個(gè)因在載荷值>0.5，如果所有因子載荷值均<0.5，則說明該變量不具有收斂效度，需刪除；

第二判斷標(biāo)準(zhǔn)：變量在兩個(gè)或以上因子中的載荷值同時(shí)>0.5，則說明該變量不具有區(qū)分效度，需刪除；

第三個(gè)判斷標(biāo)準(zhǔn)：某變量單獨(dú)成為一個(gè)因子，則說明該變量也不存在收斂效度，需刪除。

5）因子得分計(jì)算：F1=x1*a1+x2*a2+…

第四節(jié) Logistic回歸

應(yīng)用場景：做分類預(yù)測模型，且為非參數(shù)檢驗(yàn)方法。可以用于二分類、無序多分類、有序多分類。

1、二元Logistic回歸

1）結(jié)果解讀：1）根據(jù)檢驗(yàn)中的p<0.05，得到自變量對因變量存在顯著影響。

2）根據(jù)瓦爾德值的大小，判斷自變量對因變量的影響程度排名。

3）優(yōu)勢比（OR）值>1，表示該自變量會增加因變量取1的概率的發(fā)生；反之會降低因變量取1的概率。

4）連續(xù)變量對因變量的影響程度：在其他變量不變的情況下，當(dāng)年齡增加一個(gè)單位，優(yōu)勢比增加1.385倍（年齡越大，退休概率越高）。

5）分類自變量對因變量的影響程度：在其他變量不變的情況下，大專學(xué)歷的優(yōu)勢比是研究生學(xué)歷優(yōu)勢比的0.120倍（大專學(xué)歷的退休概率高于研究生學(xué)歷的退休概率）。

2）Logistic公式：ln(p/（1-p）)=20.305-0.782*ed1-0.561*ed2-2.121*ed3+…

SPSS操作：分析-回歸-二元Logistic-分類：分類協(xié)變量-保存：概率&組成員-選項(xiàng)：Exp的置信區(qū)間

2、多元Logistic回歸

SPSS操作：分析-回歸-多元Logistic-保存：預(yù)測類別&預(yù)測類別概率

3、有序Logistic回歸

首先需要進(jìn)行平行性檢驗(yàn)，檢驗(yàn)當(dāng)因變量劃分不停取值時(shí)建立的多個(gè)二元Logistic回歸

，自變量對因變量的影響程度是相同的；如果該檢驗(yàn)不成立，則不能選擇有序多分類模型，改用無序多分類模型。

當(dāng)P>0.05時(shí)，說明原假設(shè)成立，則平行性檢驗(yàn)成立，可以建立有序多分類模型。

解讀：

1）模型公式

ln(p1/(1-p1))=-2.494-0.032*age+0.003*income (p1表示學(xué)歷取1的概率)
ln(p2/(1-p2))=-1.110-0.032*age+0.003*income (p2表示學(xué)歷取1的概率)
ln(p3/(1-p3))=-0.192-0.032*age+0.003*income (p3表示學(xué)歷取1的概率)
ln(p4/(1-p4))=1.649-0.032*age+0.003*income (p4表示學(xué)歷取1的概率)

SPSS操作：分析-回歸-有序-輸出：平行線檢驗(yàn)&估算響應(yīng)概率&預(yù)測類別&預(yù)測類別概率

第四節(jié) 時(shí)間序列回歸

1、格蘭杰因果檢驗(yàn)

因果關(guān)系成立的三個(gè)條件：

1）AB兩個(gè)事件必須存在相關(guān)性

2）原因A必須發(fā)生在結(jié)果B之前

3）排除其他干擾因素

2、平穩(wěn)序列

ARIMA模型建立的前提是時(shí)間序列數(shù)據(jù)必須為平穩(wěn)序列，可通過單位根檢驗(yàn)（ADF）來判斷一個(gè)序列是否平穩(wěn)；如果不平穩(wěn)，可通過差分進(jìn)行轉(zhuǎn)換。

3、周期性計(jì)算

1）通過自相關(guān)系數(shù)（ACF）圖的拐點(diǎn)，乘以4得到周期。

SPSS操作：

定義時(shí)間：數(shù)據(jù)-定義日期和時(shí)間
分析-時(shí)間序列預(yù)測

2）譜分析

通過頻率取值最高的點(diǎn)對應(yīng)的頻率乘以數(shù)據(jù)量，得到周期。

SPSS操作：分析-時(shí)間序列預(yù)測-譜分析

4、解讀：

1）時(shí)間序列假設(shè)檢驗(yàn)

通過Ljung-Box Q檢驗(yàn)，原假設(shè)是：模型可以很好的擬合原始數(shù)據(jù),p>0.05，表示模型可以接受，p值越大模型越好。

2）模型

Yt=8.579+0.999*Yt-1+0.633*Yt-12

3）時(shí)間序列因果模型

Y1t=a1*Y1t-1+a2*Y1t-12+a3*Y4t-2+a4*Y2t-12+a0

總結(jié)

以上是生活随笔為你收集整理的datagrid出现相同两组数据_数据分析之统计学的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： CPU中三核是什么
下一篇： icu入院宣教流程图_ICU患者及家属的