datagrid出现相同两组数据_数据分析之统计学
統(tǒng)計(jì)學(xué)知識
- 思維導(dǎo)圖
第一節(jié) 統(tǒng)計(jì)學(xué)基本原理
- 數(shù)據(jù)分析相關(guān)概念
一、描述統(tǒng)計(jì)
1.定類(nominal)
功能:分類的作用,比如性別
2.定序(ordinal)
功能:分類、排序的作用,比如最想去的國家
3.定距(scale)
功能:分類、排序、加減,比如溫度
4.定比(scale)
功能:分類、排序、加減、乘除,比如年齡
定類與定序合并成分類變量,定距與定比合并成連續(xù)變量。
分類變量的描述統(tǒng)計(jì)方法只能用頻次統(tǒng)計(jì),對于連續(xù)變量既可以用頻次統(tǒng)計(jì)也可以用均值和標(biāo)準(zhǔn)差。
1.算數(shù)平均
2.幾何平均
3.調(diào)和平均
可能用在數(shù)據(jù)中較多數(shù)值集中在最小值附近,原因可能是因?yàn)檎{(diào)和平均相對于算數(shù)、幾何平均最小。
4.調(diào)整平均
去掉上限值或者下限值,比例一般為5%
1.中位數(shù):
當(dāng)一組序列數(shù)據(jù)之間差異較大時(shí),導(dǎo)致平均值代表性較弱,可通過中位數(shù)來表示數(shù)據(jù)的集中趨勢。
平均值、中位數(shù)通常應(yīng)用在連續(xù)變量中,即數(shù)值型變量;
眾數(shù)既可以應(yīng)用在連續(xù)變量也可以應(yīng)用在分類變量。
衡量離散趨勢,數(shù)據(jù)離散趨勢代表了數(shù)據(jù)中包含的信息量。
1.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差計(jì)算公式中,有的除以n,有的除以n-1;
當(dāng)計(jì)算總體數(shù)據(jù)標(biāo)準(zhǔn)差時(shí),除以n,
通過樣本數(shù)據(jù)計(jì)算總體標(biāo)準(zhǔn)差時(shí),除以n-1;
原因是人為增大標(biāo)準(zhǔn)差以提高代表性。
2.離散趨勢
如果希望比較兩組數(shù)據(jù)的離散趨勢,不能直接比較兩組數(shù)據(jù)的標(biāo)準(zhǔn)差,因?yàn)閮山M數(shù)據(jù)的樣本量和均值不同。通常選用離散系數(shù)來進(jìn)行比較,離散系數(shù)=標(biāo)準(zhǔn)差/平均值
二、總體推斷/假設(shè)檢驗(yàn)
1.Z值轉(zhuǎn)換公式
Z=(xi-x)/s
用來將t分布轉(zhuǎn)換為(0,1)z分布,又稱為標(biāo)準(zhǔn)化,或者叫Z值標(biāo)準(zhǔn)化;用于判斷哪些數(shù)值為異常值,|Z值|>3為異常值,|Z值|>5為極端值。
2.置信度
T=1.65 對應(yīng)90%的置信度
T=1.98 對應(yīng)95%的置信度
T=2.58 對應(yīng)99%的置信度
3.假設(shè)檢驗(yàn)
步驟:
P<5%,則拒絕原假設(shè)H0,接受研究假設(shè)H1;
P>5%,則接受原假設(shè)H0,拒絕研究假設(shè)H1。
三、抽樣方法
1、分層抽樣
如何讓選擇分層變量
四、卡方檢驗(yàn)
假設(shè)檢驗(yàn)的結(jié)論:
p>0.05,則原假設(shè)成立,研究假設(shè)不成立;
P<0.05,則原假設(shè)不成立,研究假設(shè)成立。
1.卡方檢驗(yàn)的重要性
適用于不知道總體參數(shù)的檢驗(yàn),是最常用的一種非參數(shù)檢驗(yàn)。
當(dāng)不適用于參數(shù)檢驗(yàn)法的時(shí)候,第一個(gè)想到的就是卡方檢驗(yàn)。
2.卡方檢驗(yàn)的應(yīng)用場景
檢驗(yàn)一個(gè)變量中取值的比例分布是否相等,或者是否符合設(shè)定的比例分布
原假設(shè):變量的取值分布與均勻分布(研究者設(shè)定的分布)沒有顯著差異
研究假設(shè):變量的取值分布與均勻分布(研究者設(shè)定的分布)有顯著差異
SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-卡方
檢驗(yàn)一個(gè)變量取二分類兩個(gè)值的概率是否符合設(shè)定的概率
原假設(shè):變量的第一個(gè)取值比例與設(shè)定比例沒有顯著差異。
研究假設(shè):變量的第一個(gè)取值與設(shè)定比例有顯著差異。
SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-二項(xiàng)
- 分割點(diǎn):是將一個(gè)連續(xù)變量,選擇一個(gè)值作為分割點(diǎn)
檢驗(yàn)樣本來自的總體中,一個(gè)變量的分布是否服從正態(tài)分布、均勻分布、泊松分布、指數(shù)分布
原假設(shè):變量來自總體的分布與正態(tài)分布(均勻分布等)沒有顯著差異,即變量在總體中呈現(xiàn)正態(tài)分布(或均勻分布等)。
研究假設(shè):變量來自總體的分布與正態(tài)分布(均勻分布等)有顯著差異,即變量在總體中不呈現(xiàn)正態(tài)分布(或均勻分布等)。
SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-單樣本K-S
檢驗(yàn)一個(gè)變量的兩個(gè)取值的出現(xiàn)順序是否隨機(jī)。兩個(gè)值出現(xiàn)比例各占50%。
檢驗(yàn)場景:通常是檢驗(yàn)隨著時(shí)間變化而產(chǎn)生的兩個(gè)數(shù)值,出現(xiàn)順序是否隨機(jī)。
原假設(shè):變量的兩個(gè)值的出現(xiàn)順序和隨機(jī)出現(xiàn)沒有顯著差異。
研究假設(shè):變量的兩個(gè)值的出現(xiàn)順序不是隨機(jī)的。
SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-游程檢驗(yàn)
獨(dú)立樣本:兩組不重疊的樣本,檢驗(yàn)不同人群在特定變量在取值上是否有差異;
比如男性和女性在收入分布上是否有差異。
原假設(shè):兩組來自總體的變量數(shù)據(jù)在分布上沒有顯著差異,即兩組數(shù)據(jù)在該變量的取值上沒有顯著差異。
研究假設(shè):兩組來自總體的變量數(shù)據(jù)在分布上有顯著差異,即兩組數(shù)據(jù)在該變量的取值上有顯著差異。
注意:分組變量是分類變量,比較變量是連續(xù)變量
SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-2個(gè)獨(dú)立樣本
配對樣本:同一組人群不同時(shí)間采集的兩組或多組數(shù)據(jù),或者同一組人群不同身體部位所采集的兩組或多組數(shù)據(jù)。
檢驗(yàn)同一組人群在不同時(shí)間、不用部位采集的數(shù)據(jù)是否有差異。
原假設(shè):來自總體的同一組人群的兩組數(shù)據(jù)在分布上沒有顯著差異,即兩組數(shù)據(jù)在該變量的取值上沒有顯著差異。
研究假設(shè):來自總體的同一組人群的兩組數(shù)據(jù)在分布上有顯著差異,即兩組數(shù)據(jù)在該變量的取值上有顯著差異。
注意:t1、t2,比較的變量必須是連續(xù)變量
SPSS操作:分析-非參數(shù)檢驗(yàn)-舊對話框-2個(gè)相關(guān)樣本
檢驗(yàn)兩個(gè)分類變量(定類和定序)是否有相關(guān)性。
如果場景中需要對連續(xù)變量進(jìn)行卡方檢驗(yàn),首先需要將連續(xù)變量轉(zhuǎn)換為分類變量;如年齡分成70后、80后、90后、00后。
SPSS操作:分析-描述統(tǒng)計(jì)-交叉表
- 連續(xù)變量轉(zhuǎn)換成分類變量的操作:轉(zhuǎn)換-重新編碼為不同變量,收入分為0-50,51-400,401及以上
- 如果兩個(gè)變量都是定類變量,相關(guān)系數(shù)可通過卡方檢驗(yàn)中“名義”里的4個(gè)相關(guān)系數(shù);如果兩個(gè)變量都是定序變量,則選擇“有序”里的4個(gè)相關(guān)系數(shù)。
- 問:如果兩個(gè)變量中,一個(gè)為定類變量,一個(gè)為定序變量,相關(guān)系數(shù)應(yīng)該選哪個(gè)?
答;應(yīng)該選“名義”中的4個(gè)相關(guān)系數(shù)。原因是定序變量可以降級為定類變量,而定類變量不可以升級為定序變量。
- 卡方檢驗(yàn)結(jié)果解讀:
第一步:看卡方統(tǒng)計(jì)結(jié)果,根據(jù)P值判斷兩個(gè)變量是否存在相關(guān)性;如p<0.05,則說明兩者存在顯著相關(guān)性。
第二步:看相關(guān)系數(shù),判斷兩者之間相關(guān)性到底有多大。
- 0-0.2,較弱相關(guān);
- 0.2-0.4,弱相關(guān);
- 0.4-0.6,相關(guān)性一般;
- 0.6-0.8,弱強(qiáng)相關(guān);
- 0.8-1,極強(qiáng)相關(guān)。
第三步:看頻次分布,具體分析兩者存在什么樣的相關(guān)。
五、t檢驗(yàn)、方差檢驗(yàn)
1.t檢驗(yàn)
用來檢驗(yàn)樣本中某個(gè)連續(xù)變量的均值與給定的總體均值是否存在差異。
用到的變量:一個(gè)連續(xù)變量。
原假設(shè):樣本所來自總體的均值與給定的均值之間沒有顯著差異。
研究假設(shè):樣本所來自總體的均值與給定的均值之間有顯著差異。
SPSS操作:分析-比較平均值-單樣本T檢驗(yàn)
用來檢驗(yàn)兩組獨(dú)立樣本在某個(gè)連續(xù)變量的均值是否有顯著差異。
用到的變量:一個(gè)連續(xù)變量和一個(gè)分類變量(也可以將連續(xù)變量進(jìn)行分組得到一個(gè)分類變量)。
原假設(shè):樣本所來自總體的均值與給定的均值之間沒有顯著差異。
研究假設(shè):樣本所來自總體的均值與給定的均值之間有顯著差異。
SPSS操作:分析-比較平均值-獨(dú)立樣本T檢驗(yàn)
方差齊性檢驗(yàn)
原假設(shè):兩組總體中的方差是相等的(沒有差異的)。
研究假設(shè):兩組總體中的方差是不相等的(有差異的)。
當(dāng)p>0.05時(shí),原假設(shè)成立;即兩組總體中的方差是相等的,需要看第一行的t值檢驗(yàn)結(jié)果。反之則看第二行的t值檢驗(yàn)結(jié)果。
用來檢驗(yàn)同一樣本不同時(shí)間/部位/處理?xiàng)l件測量得到的兩組數(shù)據(jù)均值是否存在差異。
原假設(shè):樣本所來自總體的均值與給定的均值之間沒有顯著差異。
研究假設(shè):樣本所來自總體的均值與給定的均值之間有顯著差異。
變量:兩個(gè)人連續(xù)變量(其實(shí)是針對同一組人群不同時(shí)間/處理部位/條件測量的兩組數(shù)據(jù))
SPSS操作:分析-比較平均值-成對樣本t檢驗(yàn)
2.方差檢驗(yàn)
變量:變量既可以是分類也可以是連續(xù)變量,因變量必須是連續(xù)變量
檢驗(yàn)3組人群及以上在某個(gè)連續(xù)變量均值上是否存在差異,或某個(gè)分類變量對連續(xù)變量是否存在顯著相關(guān)。
變量:自變量為一個(gè),是分類變量;因變量是一個(gè),且為連續(xù)變量。
原假設(shè):不同人群之間在該連續(xù)變量的均值沒有顯著差異(自變量與因變量之間不存在顯著相關(guān))
研究假設(shè):不同人群之間在該連續(xù)變量的均值有顯著差異(自變量與因變量之間存在顯著相關(guān))
SPSS操作:分析-比較平均值-單因素ANOVA檢驗(yàn)
- 兩兩比較中根據(jù)方差齊性檢驗(yàn)結(jié)果,來選擇方差相等的比較結(jié)果或方差不等的檢驗(yàn)結(jié)果。
- 方差齊性檢驗(yàn):“選項(xiàng)”中-勾選“方差齊性檢驗(yàn)”。當(dāng)方差不齊時(shí),則通過非參數(shù)檢驗(yàn)中的K個(gè)獨(dú)立樣本檢驗(yàn)法進(jìn)行檢驗(yàn)。
檢驗(yàn)多個(gè)變量在某個(gè)連續(xù)變量均值上是否存在差異,或多個(gè)變量對連續(xù)變量是否存在顯著相關(guān)。
變量:自變量為多個(gè),既可以是分類變量也可以是連續(xù)變量;因變量是一個(gè),且為連續(xù)變量。
原假設(shè):多個(gè)自變量與因變量之間不存在顯著相關(guān)
研究假設(shè):多個(gè)自變量與因變量之間存在顯著相關(guān)
SPSS操作:分析-一般線性模型-單變量
- 全因子模型:既考慮所有自變量對于因變量的直接效應(yīng),又考慮所有分類變量的交互作用對因變量的影響。
- 構(gòu)建項(xiàng)(定制模型):可根據(jù)研究者自身需求,定制需要考慮的對因變量的影響因素。比如只考慮自變量的直接效應(yīng),或部分自變量的交互作用。
- 當(dāng)自變量特別多時(shí),尤其是分類自變量特別多時(shí),且樣本量不多時(shí),應(yīng)該使用定制模型。
一個(gè)因變量,在多個(gè)時(shí)刻重復(fù)測量多次,自變量可以有也可以沒有
- 因素(Factor)
因素是可能對因變量有影響的變量,一般來說,因素會不止一個(gè)水平,而分析的目的就是考察或比較各個(gè)水平對一變量的影響是否相同。
- 水平(Level)
因素的不同取值等級稱作水平,例如八性別有男、女兩個(gè)水平。
- 單元(Cell)
單元亦稱實(shí)驗(yàn)水平(Experimental Unit),指各因素水平之間的每種組合。指各因素各水平的組合,例如在研究性別(二水平)、血型(四水平)對成年人身高的影響時(shí),該設(shè)計(jì)最多可以有2*4=8個(gè)單元。注意在一些特殊的實(shí)驗(yàn)設(shè)計(jì)中,可能有的單元在樣本中并不會出現(xiàn),如正交設(shè)計(jì)。
- 元素(Element)
- 指用于測量因變量值的觀察單位,比如研究職業(yè)與收入之間的關(guān)系,月收入是從每一位受訪者處得到,則每位受訪者就是實(shí)驗(yàn)的因素。
- 一個(gè)單元格內(nèi)可以有多個(gè)元素,也可以只有一個(gè),甚至于沒有元素。
- 注意:元素不一定等同于受訪者個(gè)體!
- 重復(fù)測量數(shù)據(jù)
- 以家庭為單位收集資料
- 均衡(Balance)
如果在一個(gè)實(shí)驗(yàn)設(shè)計(jì)中任一因素各水平在所有單元格中出現(xiàn)的次數(shù)相同,且每個(gè)單元格內(nèi)的元素?cái)?shù)均相同,則該試驗(yàn)是均衡的;否則,就被稱為不均衡。不均衡的實(shí)驗(yàn)設(shè)計(jì)在分析時(shí)較為復(fù)雜,需要對方差分析模型作特別設(shè)置才能得到正確的分析結(jié)果。
- 協(xié)變量(Covariates)
指對因變量可能有影響,需要在分析時(shí)對其作用加以控制的連續(xù)變量,實(shí)際上,可以簡單的把因素和協(xié)變量分別理解為分類自變量和連續(xù)自變量。當(dāng)模型中存在協(xié)變量時(shí),一般是通過找出它與因變量的回歸關(guān)系來控制其影響。
- 交互作用(Interaction)
- 如果一個(gè)因素的效應(yīng)大小在另一個(gè)因素不同水平下明顯相同,則稱為兩因素間存在交互作用。當(dāng)存在交互作用時(shí),單純研究某個(gè)因素的作用是沒有意義的,必須分另一個(gè)因素的不同水平研究該因素的作用大小。
- 如果所有單元格內(nèi)都至多只有一個(gè)元素,則交互作用無法進(jìn)行分析,只能不予考慮。
- 固定因素(Fixed Factor)
- 指的是該因素在樣本中所有可能的水平都出現(xiàn)了。從樣本的分析結(jié)果中就可以得到所有水平的狀況,無需進(jìn)行外推。絕大多數(shù)情況下,研究者所真正關(guān)心的因素都是固定因素。
- 性別:只有兩種
- 療法:只有三種
- 隨機(jī)因素(Random Factor)
- 該因素所有的可能取值在樣本中沒有出現(xiàn),目前在樣本中的這些水平是從總體中隨機(jī)抽樣而來,如果我們重復(fù)該研究,則可能得到的因素水平會和現(xiàn)在完全不同!
- 這時(shí),研究者顯然希望得到的是一個(gè)能夠“泛化”,即對所有可能出現(xiàn)的水平均適用的結(jié)果。這不可避免的存在誤差,需要估計(jì)誤差的大小,因此被稱為隨機(jī)因素。
第二節(jié) 多指標(biāo)統(tǒng)計(jì)分析
- 多變量分析方法的選擇
| 分析的目的 | 有無目標(biāo)變量(因變量、外部推測) | 目標(biāo)變量的數(shù)據(jù)類型 | 解釋變量 | 具有代表的多變量分析的例子 |
| 有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果) | 有 | 定量數(shù)據(jù)(量的數(shù)據(jù)) | 定量數(shù)據(jù) | 多元回歸分析方差分析 |
| 定性數(shù)據(jù) | 有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析 | |||
| 定性數(shù)據(jù)(質(zhì)的數(shù)據(jù)) | 定量數(shù)據(jù) | 判別分析(discriminate analysis)Logistic/probit analysis | ||
| 定性數(shù)據(jù) | 對數(shù)線性回歸 | |||
| 無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu) | 沒有 | —— | 定量數(shù)據(jù) | 因子分析(factor analysis)聚類分析(cluster analysis) |
| 定性數(shù)據(jù) | 對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling) | |||
| (其他的分析) | 加入潛在變量的因果關(guān)系分析模型 | 結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型 | ||
| 基于多個(gè)候補(bǔ)方案的一對一比較分析模型 | 層次分析法(analytic hierarchy process-AHP)因子分析 |
- 分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
| 分析的目的 | 有無目標(biāo)變量(因變量、外部推測) | 目標(biāo)變量的數(shù)據(jù)類型 | 解釋變量 | 具有代表的多變量分析的例子 |
| 有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果) | 有 | 定量數(shù)據(jù)(量的數(shù)據(jù)) | 定量數(shù)據(jù) | 多元回歸分析方差分析 |
| 定性數(shù)據(jù) | 有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析 | |||
| 定性數(shù)據(jù)(質(zhì)的數(shù)據(jù)) | 定量數(shù)據(jù) | 判別分析(discriminate analysis)Logistic/probit analysis | ||
| 定性數(shù)據(jù) | 對數(shù)線性回歸 | |||
| 無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu) | 沒有 | —— | 定量數(shù)據(jù) | 因子分析(factor analysis)聚類分析(cluster analysis) |
| 定性數(shù)據(jù) | 對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling) | |||
| (其他的分析) | 加入潛在變量的因果關(guān)系分析模型 | 結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型 | ||
| 基于多個(gè)候補(bǔ)方案的一對一比較分析模型 | 層次分析法(analytic hierarchy process-AHP)因子分析 |
<table data-draft-node="block" data-draft-type="table" data-size="normal" data-row-style="normal">分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
- 分析的目的有無目標(biāo)變量(因變量、外部推測)目標(biāo)變量的數(shù)據(jù)類型解釋變量具有代表的多變量分析的例子有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果)有定量數(shù)據(jù)(量的數(shù)據(jù))定量數(shù)據(jù)多元回歸分析方差分析定性數(shù)據(jù)有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析定性數(shù)據(jù)(質(zhì)的數(shù)據(jù))定量數(shù)據(jù)判別分析(discriminate analysis)Logistic/probit analysis定性數(shù)據(jù)對數(shù)線性回歸無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu)沒有——定量數(shù)據(jù)因子分析(factor analysis)聚類分析(cluster analysis)定性數(shù)據(jù)對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling)(其他的分析)加入潛在變量的因果關(guān)系分析模型結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型基于多個(gè)候補(bǔ)方案的一對一比較分析模型層次分析法(analytic hierarchy process-AHP)因子分析
| 分析的目的 | 有無目標(biāo)變量(因變量、外部推測) | 目標(biāo)變量的數(shù)據(jù)類型 | 解釋變量 | 具有代表的多變量分析的例子 |
| 有監(jiān)督分析需要用多個(gè)因素來預(yù)測、解釋、判斷某個(gè)項(xiàng)目(想要用數(shù)學(xué)方法描述由多個(gè)原因引起的結(jié)果) | 有 | 定量數(shù)據(jù)(量的數(shù)據(jù)) | 定量數(shù)據(jù) | 多元回歸分析方差分析 |
| 定性數(shù)據(jù) | 有虛擬變量的回歸分析聯(lián)合分析(conjoint analysis)方差分析 | |||
| 定性數(shù)據(jù)(質(zhì)的數(shù)據(jù)) | 定量數(shù)據(jù) | 判別分析(discriminate analysis)Logistic/probit analysis | ||
| 定性數(shù)據(jù) | 對數(shù)線性回歸 | |||
| 無監(jiān)督分析1想要?dú)w并相似者2想要用圖表解釋變量之間的線性關(guān)系3想要概括變量之間的關(guān)系4想要知道解釋項(xiàng)目之間的相關(guān)關(guān)系的潛在結(jié)構(gòu) | 沒有 | —— | 定量數(shù)據(jù) | 因子分析(factor analysis)聚類分析(cluster analysis) |
| 定性數(shù)據(jù) | 對應(yīng)分析(correspondence analysis)多維尺度法(militiamen signal scaling) | |||
| (其他的分析) | 加入潛在變量的因果關(guān)系分析模型 | 結(jié)構(gòu)方程模型(協(xié)方差結(jié)構(gòu)分析(covariance tructure analysis; strucural equation model-SEM))路徑模型 | ||
| 基于多個(gè)候補(bǔ)方案的一對一比較分析模型 | 層次分析法(analytic hierarchy process-AHP)因子分析 |
1、有因變量,則建立監(jiān)督模型
- 有監(jiān)督模型具有兩大通用目的:
1)分析哪些自變量對因變量存在顯著影響作用;
2)通過選擇對因變量存在顯著影響的自變量,建立預(yù)測因變量取值的預(yù)測模型。
1)
a)因變量為連續(xù)變量(建立的模型稱為回歸預(yù)測模型),自變量為連續(xù)變量時(shí),可選擇回歸分析、方差分析;
b)自變量為分類變量或分類+連續(xù)變量時(shí),可選擇帶虛擬變量的回歸分析、聯(lián)合分析、方差分析。
2)因變量為分類變量(建立的模型稱為分類預(yù)測模型)
a)當(dāng)自變量為分類變量(或連續(xù)+分類變量)時(shí),可選用判別分析、Logistic、probit回歸等;
b)當(dāng)自變量全部為分類變量時(shí),可選用對數(shù)線性回歸。
2、無因變量,則建立監(jiān)督模型
- 目的:
(1)對人進(jìn)行分類;(2)對變量/指標(biāo)進(jìn)行分類;(3)分析變量與變量之間的測量關(guān)系。
1)自變量為連續(xù)變量時(shí),選擇因子分析(對變量/指標(biāo)進(jìn)行分類)、聚類分析(對人分類、對變量/指標(biāo)進(jìn)行分類)
2)自變量為分類變量時(shí),選擇對應(yīng)分析(對人進(jìn)行分類)、多維尺度分析(對人進(jìn)行分析)
3、其他分析
1)當(dāng)模型中需要加入潛在變量(通過多個(gè)客觀指標(biāo)測量的抽象概念,例如幸福感)、或需要考慮多個(gè)變量之間的因果關(guān)系時(shí),可選擇結(jié)構(gòu)方程模型、路徑模型等。
2)綜合評價(jià):通過多個(gè)指標(biāo)對多個(gè)評價(jià)對象進(jìn)行排名,可選用層次分析法、因子分析等。
第一節(jié) 相關(guān)分析
- 不同變量類型的相關(guān)系數(shù)
1)兩個(gè)變量都為連續(xù)變量,則可用pearson相關(guān)系數(shù);
2)兩個(gè)變量都為定序變量,則可用GMMA等相關(guān)系數(shù);
3)兩個(gè)變量都為定類變量,則可用LAMMDA相關(guān)系數(shù);
4)一個(gè)變量為定類變量,一個(gè)變量為連續(xù)變量,則可通過ETA系數(shù)來測量相關(guān)性。
- 相關(guān)系數(shù)是衡量兩個(gè)變量之間變化趨勢的相似性。
- 相關(guān)系數(shù)的目的:計(jì)算兩個(gè)變量在樣本系數(shù)中的相關(guān)性強(qiáng)弱。
- 相關(guān)分析的假設(shè)檢驗(yàn)
原假設(shè):兩個(gè)變量來自的總體中不存在顯著相關(guān)性;
研究假設(shè):兩個(gè)變量來自的總體中存在顯著相關(guān)性。
- 顯著性檢驗(yàn)的目的:用來判斷兩個(gè)變量在總體中是否存在相關(guān)性。
1、雙變量相關(guān)分析
1)皮爾遜(pearson)相關(guān)系數(shù):參數(shù)檢驗(yàn),針對兩個(gè)都是連續(xù)變量的數(shù)據(jù)進(jìn)行相關(guān)性判斷。
2)斯皮爾曼(spearman)相關(guān)系數(shù),非參數(shù)檢驗(yàn),針對兩個(gè)都是定序變量。
3)肯德爾tau-b(Kendall's tau-b)相關(guān)系數(shù),非參數(shù)檢驗(yàn),針對兩個(gè)都是定序變量
SPSS操作:分析-相關(guān)-雙變量
2、偏相關(guān)系數(shù)
在很多現(xiàn)實(shí)情況,單純兩個(gè)變量之間的相關(guān)性,還會受到其他變量的干擾,因此考察兩個(gè)變量的相關(guān)性時(shí)往往需要剔除干擾變量的影響,再來計(jì)算相關(guān)性。比如,商品需求量和價(jià)格、消費(fèi)者收入之間的關(guān)系,需求量與價(jià)格之間的相關(guān)關(guān)系還包含了消費(fèi)者收入對商品需求量的影響。同時(shí),收入對價(jià)格也會產(chǎn)生影響,并通過價(jià)格變動傳遞到對商品需求量的影響中。
注意:計(jì)算相關(guān)性的變量為連續(xù)變量,加入控制的變量同樣也是連續(xù)變量。
3.典型相關(guān)分析(又稱為規(guī)則相關(guān)分析)
用來分析兩組變量整體的相關(guān)性,而不是變量個(gè)體之間的相關(guān)性,兩組變量的個(gè)數(shù)可以不同。測量的仍然是變量之間的線性相關(guān)性。要求每組內(nèi)的變量也呈現(xiàn)線性關(guān)系,另外組內(nèi)變量間不能存在高度的復(fù)共線性。原始數(shù)據(jù)標(biāo)準(zhǔn)化之后再計(jì)算,則得到標(biāo)準(zhǔn)化的相關(guān)系數(shù)。
SPSS操作:分析-相關(guān)-典型相關(guān)性
第二節(jié) 回歸分析
1、當(dāng)需要用一個(gè)數(shù)學(xué)表達(dá)式(模型)表示多個(gè)因素(原因)與另外一個(gè)因素(原因)之間的關(guān)系時(shí),可選用回歸分析法。
- 回歸分析的目的:
1)分析哪些自變量對因變量存在顯著影響作用,R方值可以要求不大于0.8;
2)通過選擇對因變量存在顯著影響的自變量,建立預(yù)測因變量取值的預(yù)測模型;模型R方值必須要求大于等于0.8。
但是,在人文社科領(lǐng)域,很多回歸模型的R方值達(dá)不到0.8,也可以用來做預(yù)測。
2、回歸分析的建立步驟
1)選擇變量
因變量:根據(jù)研究需求或問題推到出來
自變量:1)前人的研究成果
2)個(gè)人經(jīng)驗(yàn)
2)確定自變量與因變量之間的關(guān)系
首先,挨個(gè)將自變量與因變量畫散點(diǎn)圖,判斷每個(gè)自變量與因變量之間是線性關(guān)系還是非線性關(guān)系。
其次,通過卡方檢驗(yàn),T檢驗(yàn)、F檢驗(yàn)或相關(guān)分析法,挨個(gè)分析每個(gè)備選的自變量與因變量之間是否存在顯著的相關(guān)性。將與因變量沒有顯著相關(guān)性的自變量剔除掉,不加入到后期的模型中。
3)選擇對應(yīng)的線性方程或非線性方程,進(jìn)行各項(xiàng)參數(shù)的計(jì)算
4)對模型進(jìn)行全方位檢驗(yàn)
- 多重共線性檢驗(yàn)
檢驗(yàn)多個(gè)自變量之間是否存在相關(guān)性較高的變量,如有,則保留與因變量相關(guān)性最高的一個(gè)自變量。
- 模型擬合度檢驗(yàn)
- 方差檢驗(yàn):檢驗(yàn)把自變量與因變量是否存在顯著影響關(guān)系;
- 判定系數(shù)(R方):0-1之間,越接近1表示自變量對因變量的解釋能力越高,模型越好;
- 殘差檢驗(yàn):常用的方法包括殘差正態(tài)性檢驗(yàn)、DW檢驗(yàn)、異方差檢驗(yàn);
- 自變量參數(shù)檢驗(yàn):(參數(shù)估計(jì)方法:普通最小二乘法(OLS: Ordinary Least Square)和極大似然估計(jì)(MLE: Maximum Likelihood Estimate) )
3、回歸分析的軟件操作
解決問題:分析影響人們家庭收入的因素有哪些,建立預(yù)測回收的預(yù)測模型。
因變量:家庭收入
自變量:性別,年齡,學(xué)歷,工作年限
SPSS操作:分析-回歸-線性-
統(tǒng)計(jì):共線性診斷&德賓-沃森(DW)-圖-標(biāo)準(zhǔn)化殘差圖:直方圖&正態(tài)概率圖
4、虛擬變量
使用虛擬變量的原因:分類變量無法參與到回歸模型中加減乘除運(yùn)算
SPSS操作:將原先的分類編碼統(tǒng)一轉(zhuǎn)換為0,1數(shù)值
轉(zhuǎn)換-重新編碼為不同變量-舊值和新值-定義舊值與新值的轉(zhuǎn)換關(guān)系
Ed=1 2 3 4 5
| 1 | 2 | 3(對照人群) | 4 | 5 | |
| Ed1 | 1 | 0 | 0 | 0 | 0 |
| Ed2 | 0 | 1 | 0 | 0 | 0 |
| Ed3 | 0 | 0 | 0 | 1 | 0 |
| Ed4 | 0 | 0 | 0 | 0 | 1 |
5、回歸分析的結(jié)果解讀
1)擬合優(yōu)度檢驗(yàn)
R方值
F值,F值對應(yīng)的概率P值<0.05,研究假設(shè)成立,即至少有一個(gè)自變量對因變量存在顯著影響。
2)參數(shù)顯著性檢驗(yàn)
根據(jù)每個(gè)自變量的t值對應(yīng)的概率p值是否<0.05,如<0.05,則研究假設(shè)成立,即該自變量對因變量存在顯著影響。
根據(jù)下表得出:
工作年限和學(xué)歷對收入存在顯著影響,而年齡和性別沒有。通過標(biāo)準(zhǔn)化系數(shù)來判斷兩者的影響程度大小,可知工作年限的影響明顯大于學(xué)歷。
工作年限對收入影響程度:在其他變量不變的情況下,工作年限每增加一個(gè)單位(1年),則因變量家庭收入平均增加6.279個(gè)單位。
學(xué)歷對收入的影響程度:ed1=-51.042表示ed1代表的學(xué)歷(高中以下)比對照的學(xué)歷人群(大專)在因變量家庭收入上平均低51.042個(gè)單位。
3)共線性檢驗(yàn)
通常根據(jù)VIF>10,自變量之間存在共線性。
4)殘差檢驗(yàn)
DW=2,表示殘差不存在自相關(guān)性。
5)回歸方程
先通過逐步回歸法,將對因變量沒有顯著影響的自變量從模型中刪除,得到干凈的模型。
方程:y=34.601+6.021*工作年限-62.647*ed1-36.379*ed2。
6、非線性回歸
求解方式:
- 第一種是線性轉(zhuǎn)換,原因是非線性方程擬合方法和參數(shù)初始值設(shè)置均會導(dǎo)致求出的結(jié)果并非全局最優(yōu)解。
- 第二種是直接建立非線性方程,求解非線性模型。
SPSS操作:先通過散點(diǎn)圖判斷是否存在非線性關(guān)系
自變量:Ininc
因變量:Income
Income=e^ Ininc
第三節(jié) 因子分析
目的:對多個(gè)具有相似度的目標(biāo)/變量進(jìn)行降維,前提是這些變量/指標(biāo)之間必須存在一定的相關(guān)性/相似性
1、應(yīng)用場景:
1)降維后做綜合評價(jià)
2)效度檢驗(yàn):對抽樣概念的測量工具進(jìn)行有效性檢驗(yàn),判斷哪些指標(biāo)需要保留或刪除,并對保留的指標(biāo)進(jìn)行圍堵劃分。
3)降維后做其他分析:由于變量之間存在較高相關(guān)性,不適合做回歸分析、聚類等其他分析,需要用因子分析消除變量較高的共線性。
2、因子旋轉(zhuǎn)的目的
1)使得因子可以更好的代表原來的變量
2)降低或消除提取因子之間的相關(guān)性
SPSS操作:分析-降維-因子-描述:KMO-提取:碎石圖-旋轉(zhuǎn):最大方差法-得分:保存為變量&顯示因子得分系數(shù)矩陣-選項(xiàng):按大小排序&排除小系數(shù)
3、因子分析的結(jié)果解讀
1)KMO>0.7,適合做因子分析
2)累計(jì)方差貢獻(xiàn)率需要達(dá)到多少才合適?
如果通過因子分析降維后做綜合評價(jià),那么累計(jì)方差貢獻(xiàn)率需要>80%;
效度檢驗(yàn)或其他分析,60%以上。
3)因子劃分:根據(jù)每個(gè)變量在每個(gè)因子中的取值是否>0.5。
4)效度檢驗(yàn):
第一判斷標(biāo)準(zhǔn):每個(gè)變量有且只有一個(gè)因在載荷值>0.5,如果所有因子載荷值均<0.5,則說明該變量不具有收斂效度,需刪除;
第二判斷標(biāo)準(zhǔn):變量在兩個(gè)或以上因子中的載荷值同時(shí)>0.5,則說明該變量不具有區(qū)分效度,需刪除;
第三個(gè)判斷標(biāo)準(zhǔn):某變量單獨(dú)成為一個(gè)因子,則說明該變量也不存在收斂效度,需刪除。
5)因子得分計(jì)算:F1=x1*a1+x2*a2+…
第四節(jié) Logistic回歸
應(yīng)用場景:做分類預(yù)測模型,且為非參數(shù)檢驗(yàn)方法。可以用于二分類、無序多分類、有序多分類。
1、二元Logistic回歸
1)結(jié)果解讀:1)根據(jù)檢驗(yàn)中的p<0.05,得到自變量對因變量存在顯著影響。
2)根據(jù)瓦爾德值的大小,判斷自變量對因變量的影響程度排名。
3)優(yōu)勢比(OR)值>1,表示該自變量會增加因變量取1的概率的發(fā)生;反之會降低因變量取1的概率。
4)連續(xù)變量對因變量的影響程度:在其他變量不變的情況下,當(dāng)年齡增加一個(gè)單位,優(yōu)勢比增加1.385倍(年齡越大,退休概率越高)。
5)分類自變量對因變量的影響程度:在其他變量不變的情況下,大專學(xué)歷的優(yōu)勢比是研究生學(xué)歷優(yōu)勢比的0.120倍(大專學(xué)歷的退休概率高于研究生學(xué)歷的退休概率)。
2)Logistic公式:ln(p/(1-p))=20.305-0.782*ed1-0.561*ed2-2.121*ed3+…
SPSS操作:分析-回歸-二元Logistic-分類:分類協(xié)變量-保存:概率&組成員-選項(xiàng):Exp的置信區(qū)間
2、多元Logistic回歸
SPSS操作:分析-回歸-多元Logistic-保存:預(yù)測類別&預(yù)測類別概率
3、有序Logistic回歸
首先需要進(jìn)行平行性檢驗(yàn),檢驗(yàn)當(dāng)因變量劃分不停取值時(shí)建立的多個(gè)二元Logistic回歸
,自變量對因變量的影響程度是相同的;如果該檢驗(yàn)不成立,則不能選擇有序多分類模型,改用無序多分類模型。
當(dāng)P>0.05時(shí),說明原假設(shè)成立,則平行性檢驗(yàn)成立,可以建立有序多分類模型。
解讀:
1)模型公式
- ln(p1/(1-p1))=-2.494-0.032*age+0.003*income (p1表示學(xué)歷取1的概率)
- ln(p2/(1-p2))=-1.110-0.032*age+0.003*income (p2表示學(xué)歷取1的概率)
- ln(p3/(1-p3))=-0.192-0.032*age+0.003*income (p3表示學(xué)歷取1的概率)
- ln(p4/(1-p4))=1.649-0.032*age+0.003*income (p4表示學(xué)歷取1的概率)
SPSS操作:分析-回歸-有序-輸出:平行線檢驗(yàn)&估算響應(yīng)概率&預(yù)測類別&預(yù)測類別概率
第四節(jié) 時(shí)間序列回歸
1、格蘭杰因果檢驗(yàn)
因果關(guān)系成立的三個(gè)條件:
1)AB兩個(gè)事件必須存在相關(guān)性
2)原因A必須發(fā)生在結(jié)果B之前
3)排除其他干擾因素
2、平穩(wěn)序列
ARIMA模型建立的前提是時(shí)間序列數(shù)據(jù)必須為平穩(wěn)序列,可通過單位根檢驗(yàn)(ADF)來判斷一個(gè)序列是否平穩(wěn);如果不平穩(wěn),可通過差分進(jìn)行轉(zhuǎn)換。
3、周期性計(jì)算
1)通過自相關(guān)系數(shù)(ACF)圖的拐點(diǎn),乘以4得到周期。
SPSS操作:
- 定義時(shí)間:數(shù)據(jù)-定義日期和時(shí)間
- 分析-時(shí)間序列預(yù)測
2)譜分析
通過頻率取值最高的點(diǎn)對應(yīng)的頻率乘以數(shù)據(jù)量,得到周期。
SPSS操作:分析-時(shí)間序列預(yù)測-譜分析
4、解讀:
1)時(shí)間序列假設(shè)檢驗(yàn)
通過Ljung-Box Q檢驗(yàn),原假設(shè)是:模型可以很好的擬合原始數(shù)據(jù),p>0.05,表示模型可以接受,p值越大模型越好。
2)模型
Yt=8.579+0.999*Yt-1+0.633*Yt-12
3)時(shí)間序列因果模型
Y1t=a1*Y1t-1+a2*Y1t-12+a3*Y4t-2+a4*Y2t-12+a0
總結(jié)
以上是生活随笔為你收集整理的datagrid出现相同两组数据_数据分析之统计学的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CPU中三核是什么
- 下一篇: icu入院宣教流程图_ICU患者及家属的