當(dāng)前位置：首頁 > 人文社科 > 人文关怀 >内容正文

人文关怀

什么是统计描述统计功能指标计算

發(fā)布時間：2024/9/27 人文关怀 62 博士

生活随笔收集整理的這篇文章主要介紹了什么是统计描述统计功能指标计算小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

它研究如何用科學(xué)的方法去搜集、整理、分析經(jīng)濟(jì)和社會發(fā)展的實際數(shù)據(jù)，并通過統(tǒng)計所特有的統(tǒng)計指標(biāo)和指標(biāo)體系，表明所研究的社會經(jīng)濟(jì)現(xiàn)象的規(guī)模、水平、速度、比例和效益，以反映社會經(jīng)濟(jì)現(xiàn)象發(fā)展規(guī)律在一定時間、地點、條件下的作用，描述社會經(jīng)濟(jì)現(xiàn)象數(shù)量之間的關(guān)系和變動規(guī)律，也是進(jìn)一步學(xué)習(xí)其他相關(guān)學(xué)科的基礎(chǔ)。

描述內(nèi)容

主要包括平均指標(biāo)和變異指標(biāo)的計算、資料分布形態(tài)（或特征）的圖形表現(xiàn)等。

統(tǒng)計功能指標(biāo)計算

描述性統(tǒng)計指標(biāo)的計算可以用四個不同的過程來實現(xiàn)，它們分別是means過程、summary過程、univariate過程以及tabulate過程。它們在功能范圍和具體的操作方法上存在一定的差別，下面我們大概了解一下它們的異同點。

相同點：

他們均可計算出均數(shù)、標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)誤、總和、加權(quán)值的總和、最大值、最小值、全距、校正的和未校正的離差平方和、變異系數(shù)、樣本分布位置的t檢驗統(tǒng)計量、遺漏數(shù)據(jù)和有效數(shù)據(jù)個數(shù)等，均可應(yīng)用by語句將樣本分割為若干個更小的樣本，以便分別進(jìn)行分析。不同點：

（1）means過程、summary過程、univariate過程可以計算樣本的偏度（skewness）和峰度（kurtosis），而tabulate過程不計算這些統(tǒng)計量；

（2）univariate過程可以計算出樣本的眾數(shù)（mode），其它三個過程不計算眾數(shù)；

（3）summary過程執(zhí)行后不會自動給出分析的結(jié)果，須引用output語句和print過程來顯示分析結(jié)果，而其它三個過程則會自動顯示分析的結(jié)果；

（4）univariate過程具有統(tǒng)計制圖的功能，其它三個過程則沒有；

（5）tabulate過程不產(chǎn)生輸出資料文件（存儲各種輸出數(shù)據(jù)的文件），其它三個均產(chǎn)生輸出資料文件。

以上是它們的主要異同點，其它更為具體的異同點需要在實際應(yīng)用中去體會。掌握了各種過程的異同點，就可以根據(jù)具體需要選擇最佳的過程進(jìn)行工作。

統(tǒng)計制圖

統(tǒng)計制圖的過程均可以實現(xiàn)對樣本分布特征的圖形表示，一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。大家有沒有發(fā)現(xiàn)前兩個和后兩個只有一個字母‘g’（代表graph）的差別，其實它們之間（只差一個字母g的過程之間）的統(tǒng)計描述功能是相同的，區(qū)別僅在于繪制出的圖形的復(fù)雜和美觀程度。

chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形，只能概括地反映出資料分布的大體形狀，實際上這兩個過程繪制的圖形并不能稱之為圖形，因為他根本就沒有涉及一般意義上圖形的任何一種元素（如顏色、分辨率等）。

而gchart過程和gplot過程給出的是真正意義上的圖形，可以用很多的語句和選項來控制圖形的各方面的性質(zhì)和特征。

chart和gchart與plot和gplot的區(qū)別則體現(xiàn)在不同的作圖功能，前兩個過程可以繪制出的圖形主要有條形圖（包括橫條和豎條）、圓圖、環(huán)形圖和星形圖等，后兩個過程通常用一個記錄中的兩個變量值表示點的坐標(biāo)來繪制圖形，如散點圖和線圖等。

一般格式過程

proc means 選項列表；

by 變量名稱（分組變量）；

class 變量名稱（分組變量）；

freq變量名稱（數(shù)值變量，用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)）

var 變量名稱（待分析的數(shù)值變量）；

run；

Proc means

語句后的選項主要用來指定所要計算的統(tǒng)計量，默認(rèn)情況下，Means過程會給出頻數(shù)、均數(shù)、標(biāo)準(zhǔn)差、最大值和最小值等，其余統(tǒng)計量的計算均需要在選項中指定。class語句所指定的分組變量用來進(jìn)行分組，而by語句所指定的分組變量是用來將數(shù)據(jù)分為若干個更小的樣本，以便SAS分別在各小樣本內(nèi)進(jìn)行各自獨立的處理。freq語句和weight語句分別引導(dǎo)代表記錄出現(xiàn)頻數(shù)和權(quán)重系數(shù)的數(shù)值變量。var語句引導(dǎo)所要進(jìn)行分析的所有變量的列表，SAS將對var語句所引導(dǎo)的所有變量分別進(jìn)行描述性統(tǒng)計分析。

summary

proc summary 選項列表；

by 變量名稱（分組變量）；

class 變量名稱（分組變量）；

freq變量名稱（數(shù)值變量，用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)）

output 統(tǒng)計量關(guān)鍵字=自定義變量名

var 變量名稱（待分析的數(shù)值變量）；

run；

summary過程的格式和means過程可以說是完全相同的，各條語句和選項的含義也是相同的，包括在means過程中未列出的output語句也可以應(yīng)用于means過程，只是此語句在summary過程應(yīng)用較多（這樣才能將分析結(jié)果顯示出來），所以才將其列入一般格式中。output語句用來對分析結(jié)果輸出為數(shù)據(jù)文件進(jìn)行控制，其后的選項可有可無，若無則SAS按照默認(rèn)方式進(jìn)行?！皁ut=數(shù)據(jù)集名”用來定義輸出數(shù)據(jù)文件的文件名稱，文件名的格式和數(shù)據(jù)步中數(shù)據(jù)文件名相同?！敖y(tǒng)計量關(guān)鍵字=自定義變量名”用來自定義輸出數(shù)據(jù)文件中各種統(tǒng)計量的變量名稱，前者是系統(tǒng)定義的（和proc語句后選項中的統(tǒng)計量關(guān)鍵字完全相同），必須正確無誤，后者可自行定義。默認(rèn)狀態(tài)下輸出統(tǒng)計量只有頻數(shù)、均數(shù)、標(biāo)準(zhǔn)差、最大值和最小值，在默認(rèn)狀態(tài)不能滿足需要時這一選項則是必需的。

univariate

proc univariate 選項列表；

by 變量名稱（分組變量）；

class 變量名稱（分組變量）；

freq變量名稱（數(shù)值變量，用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)）

weight變量名稱（數(shù)值變量，用以表示相應(yīng)記錄的權(quán)重系數(shù)）

histogram 變量名稱/選項列表

var 變量名稱（待分析的數(shù)值變量）；

run；

univariate過程和以上兩個過程的格式非常相似，相同的語句和選項其含義也相同，所不同的是某些統(tǒng)計量只能在univariate過程中計算（如眾數(shù)），以及univariate過程中所具有的繪圖功能。histogram語句即用來指示SAS對其后所指定的變量繪制直方圖，其后的選項用來指示SAS添加不同類型的擬合圖形（如正態(tài)分布的分布密度曲線）。

tabulate

proc tabulate 選項列表；

by 變量名稱（分組變量）；

class 變量名稱（分組變量）；

freq變量名稱（數(shù)值變量，用以表示相應(yīng)記錄出現(xiàn)的頻數(shù)）

頁變量表達(dá)式，行變量表達(dá)式，列變量表達(dá)式

var 變量名稱（待分析的數(shù)值變量，統(tǒng)計量列入相應(yīng)的表單元格）；

run；

tabulate過程和上述幾個過程的格式也基本相似，相同的語句和選項也代表相同的含義。最大的不同也是tabulate過程中最為重要的是table語句，他用來定義表格的具體格式以及表格中所要包括的統(tǒng)計量。

gchart

proc gchart 選項列表；

圖形關(guān)鍵詞變量名稱/選項列表

run；

此過程格式簡單，復(fù)雜的地方在于圖形關(guān)鍵字（每個圖形關(guān)鍵字對應(yīng)一種圖形類型）所引導(dǎo)的語句，這里是控制圖形類型及圖形要素的地方，涉及到眾多的關(guān)鍵字和選項。gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型見下表（表2.1）。

表2.1 gchart過程可以使用的圖形關(guān)鍵字及其所繪制的圖形類型

圖形關(guān)鍵字

繪制的圖形類型

圖形關(guān)鍵字

繪制的圖形類型

block

方塊圖

pie

圓圖

hbar

水平的條形圖

pie3d

三維圓圖

hbar3d

水平的三維條形圖

donut

環(huán)形圖

vbar

豎立的條形圖

star

星形圖

vbar3d

豎立的三維條形圖

圖形關(guān)鍵字后的變量名用以指定進(jìn)行圖形描述時的分組變量，可以是數(shù)值型的（此時以各組的組中值為分組的標(biāo)志），也可以是字符型的。其后的選項比較重要的有：

（1）type=統(tǒng)計量關(guān)鍵字，表示以圖形對變量（sumvar所指定的變量）的哪一種統(tǒng)計量進(jìn)行描述，比如頻數(shù)（freq）、均數(shù)（mean）、總計（sum）、頻數(shù)百分比（pctn）等；

（2）subgroup=變量名（分組變量），指定要進(jìn)行分組（各組段內(nèi)再分組）的變量；

（3）sumvar=變量名（數(shù)值變量），指定要進(jìn)行統(tǒng)計計算的變量，也就是“type=統(tǒng)計量關(guān)鍵字”選項中統(tǒng) 計量的計算所依據(jù)的變量。其它的選項較少用到或系統(tǒng)默認(rèn)值即可基本滿足要求，這里還是少啰嗦，以后用到再說。

gplot

proc gplot 選項列表；

bubble 散點圖表達(dá)式

bubble2 散點圖表達(dá)式

plot散點圖表達(dá)式

plot2散點圖表達(dá)式

run；

從gplot過程的一般格式中我們就可看出，此過程只能繪制兩種類型的圖形，bubble語句指示SAS繪制泡狀散點圖，plot語句指示SAS繪制點狀散點圖。bubble2語句和plot2語句指示SAS在同一區(qū)域內(nèi)（bubble2和bubble在同一區(qū)域，plot2和plot在同一區(qū)域）繪制第二個圖形，兩者的橫坐標(biāo)相同（同一變量），縱坐標(biāo)分別位于左右兩側(cè)（可以是同一變量，也可以是兩個不同的變量）。

散點圖表達(dá)式的一般形式為：

（1）bubble和bubble2語句：縱坐標(biāo)變量名*橫坐標(biāo)變量名=泡尺寸變量名（變量值以泡的大小表示），三者均應(yīng)為數(shù)值變量；

（2）plot和plot2語句：縱坐標(biāo)變量名*橫坐標(biāo)變量名 =n ，此處等號及其后的部分可以省略，此時SAS以默認(rèn)的散點類型繪制散點圖；若等號后為n（n為正整數(shù)，是散點類型的編號），SAS則以指定的編號對應(yīng)的散點類型繪制散點圖；若等號后為分類變量名（可為字符型或數(shù)值型，為數(shù)值型時作為離散型變量處理，每一個值將被當(dāng)作一個類別），此變量的具體值（或與每個具體值對應(yīng)的圖形）將被作為散點用來繪制散點圖。

chart過程和plot過程的一般格式及各選項使用方法分別與gchart過程和gplot過程是基本相同的，不同之處僅在于后兩者中涉及到有關(guān)三維和圖形元素（顏色等）的語句和選項在前兩者中是無效的。例如vbar3d語句在chart過程中無效，bubble語句在plot過程中無效。其余的語句和選項使用方法完全相同，所以在掌握了gchart過程和gplot過程后，chart過程和plot過程你會不學(xué)自通。

總結(jié)

以上是生活随笔為你收集整理的什么是统计描述统计功能指标计算的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： C++树的层次遍历(附完整源码)
下一篇：佛媛遭媒体批评看似与世无争其实物欲横流

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

人文关怀

什么是统计描述 统计功能指标计算

總結(jié)

什么是统计描述统计功能指标计算